Joseph E. Gonzalez

Research focus

Architecture Design (Transformers, SSMs, MoE) (3)Training Efficiency & Optimization (3)Inference & Quantization (2)Computer Vision (1)

Frequent co-authors

Jintao Zhang (3)Ion Stoica (3)Haoxu Wang (2)Kai Jiang (2)

Papers (4)

Mar 9, 2026

BAIRMar 9, 2026·also Tsinghua AI, Soyeon Caren Han is the corresponding

SVG-EAR: Parameter-Free Linear Compensation for Sparse Video Generation via Error-aware Routing

Get 2x faster video generation from diffusion transformers without sacrificing quality, thanks to a clever parameter-free error compensation technique.

Xuanyi Zhou, Xuanyi Zhou, Qiuyang Mang +11

Architecture Design (Transformers, SSMs, MoE)Computer Vision Training Efficiency & Optimization

Mar 2, 2026

BAIRMar 2, 2026·also Tsinghua AI

SageBwd: A Trainable Low-bit Attention

Trainable INT8 attention can match full-precision attention during pre-training, but only if you normalize QK and reduce tokens per step.

Jintao Zhang, Jintao Zhang, Marco Chen +6

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Feb 22, 2026

Shiyi Cao +7Feb 22, 2026·also BAIR

K-Search: LLM Kernel Generation via Co-Evolving Intrinsic World Model

LLMs can now design GPU kernels that outperform both human experts and prior automated methods, thanks to a co-evolving world model that guides the search process.

Shiyi Cao, Shiyi Cao, Ziming Mao +5

Code Generation & Program Synthesis Distributed Systems & Hardware World Models & Planning

Feb 13, 2026

Tsinghua AIFeb 13, 2026·also BAIR

SLA2: Sparse-Linear Attention with Learnable Routing and QAT

Achieve an 18.6x speedup in video diffusion models with 97% attention sparsity by learning how to route and combine sparse and linear attention, outperforming heuristic approaches.

Jintao Zhang, Haoxu Wang, Kai Jiang +5

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Joseph E. Gonzalez

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (4)