Quanquan Gu

University of California

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (3)World Models & Planning (1)Inference & Quantization (1)RLHF & Preference Learning (1)

Frequent co-authors

Yifeng Liu (2)Haoyang Hong (1)Zichen Wang (1)Huazheng Wang (1)

Papers (4)

Jun 4, 2026

Jun 4, 2026·also Univer- sity of Illinois, University of California

Online KL-Regularized Reinforcement Learning with Function Approximation under Misspecification

KL-regularization can still yield high-probability guarantees even when models are misspecified, challenging the assumption that realizability is necessary for effective learning.

Haoyang Hong, Zichen Wang, Quanquan Gu +1

Training Efficiency & Optimization World Models & Planning

Jun 2, 2026

University of CaliforniaJun 2, 2026·also Princeton

Self-Distilled Policy Gradient

Self-distillation can significantly enhance reinforcement learning stability and performance, outperforming traditional methods in sparse-reward environments.

Yifeng Liu, Shiyuan Zhang, Quanquan Gu

Inference & Quantization RLHF & Preference Learning

University of CaliforniaJun 2, 2026

Unlocking Feature Learning in Gated Delta Networks at Scale

Gated Delta Networks can achieve stable learning-rate transfer across model widths, a breakthrough that significantly enhances training efficiency for large language models.

Yifeng Liu, Quanquan Gu

Architecture Design (Transformers, SSMs, MoE)Scaling Laws & Emergent Abilities Training Efficiency & Optimization

Mar 2, 2026

University of CaliforniaMar 2, 2026

Near-Optimal Regret for KL-Regularized Multi-Armed Bandits

KL-regularization in multi-armed bandits provably achieves near-optimal regret, scaling linearly with the number of arms, a significant improvement over classical results.

Kaixuan Ji, Qingyue Zhao, Heyang Zhao +2

Training Efficiency & Optimization

Search

Quanquan Gu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (4)