Berkeley AI Research (BAIR)

×Computer Vision

6 papers from Berkeley AI Research (BAIR) on Computer Vision

May 6, 2026

Physical Adversarial Clothing Evades Visible-Thermal Detectors via Non-Overlapping RGB-T Pattern

Adversarial clothing with non-overlapping visible-thermal patterns can reliably evade RGB-T detectors, even transferring across different fusion architectures.

Xiaopei Zhu, Guanning Zeng, Zhanhao Hu +2

Computer Vision Multimodal Models Red-Teaming & Adversarial Robustness

Apr 12, 2026

Tsinghua AIApr 12, 2026·also BAIR, Fudan, Shanghai Qi Zhi Institute

AffordGen: Generating Diverse Demonstrations for Generalizable Object Manipulation with Afford Correspondence

Unlock zero-shot generalization in robot manipulation by generating diverse, affordance-aware training data with 3D generative models and Vision Foundation Models.

Kaizhe Hu, Yingqian Huang, Yuanchen Ju +2

Computer Vision Data Curation & Synthetic Data Robotics & Embodied AI

Apr 9, 2026

BAIRApr 9, 2026

Self-Improving 4D Perception via Self-Distillation

Unlock 36% better video depth estimation and 20% better camera pose estimation by simply letting your model learn from its own unlabeled video predictions.

Nan Huang, Nan Huang, Pengchen Yu +9

Computer Vision Inference & Quantization Multimodal Models+1

Apr 1, 2026

BAIRApr 1, 2026·also Lambda

Multi-Camera View Scaling for Data-Efficient Robot Imitation Learning

Get 3x the imitation learning performance from your robot with just a few extra cameras.

Yichen Xie, Shuqi Zhao, Cheng-En Wu +4

Computer Vision Data Curation & Synthetic Data Robotics & Embodied AI

Feb 25, 2026

BAIRFeb 25, 2026·also Applied Intuition

Learning to Drive is a Free Gift: Large-Scale Label-Free Autonomy Pretraining from Unposed In-The-Wild Videos

Unlock autonomous driving with YouTube: a new label-free pretraining method learns driving representations directly from unposed in-the-wild videos, outperforming LiDAR baselines with only a single monocular camera.

Matthew Strong, Wei-Jer Chang, Quentin Herau +3

Computer Vision Data Curation & Synthetic Data Robotics & Embodied AI

Feb 12, 2026

Feb 12, 2026·also BAIR, Independent Researcher, McGill, Reviewerly +1

From Noise to Order: Learning to Rank via Denoising Diffusion

Denoising diffusion models can significantly outperform discriminative methods in learning-to-rank, suggesting a new path for improving information retrieval.

Sajad Ebrahimi, Bhaskar Mitra, Negar Arabzadeh +3

Architecture Design (Transformers, SSMs, MoE)Computer Vision Natural Language Processing+1

Search

Berkeley AI Research (BAIR)