Kai Han

Papers on Lattice

Total citations

Topics

h-index

Research focus

Training Efficiency & Optimization (3)Robotics & Embodied AI (1)Architecture Design (Transformers, SSMs, MoE) (1)Computer Vision (1)RLHF & Preference Learning (1)

Frequent co-authors

Hongjun Wang (1)Wei Liu (1)Weibo Gu (1)Xing Sun (1)

Papers (3)

Mar 14, 2026

Hongjun Wang +4Mar 14, 2026

MHPO: Modulated Hazard-aware Policy Optimization for Stable Reinforcement Learning

Stabilizing RL training is now possible by modulating importance ratios with hazard-aware penalties, preventing both mode collapse and policy erosion.

Hongjun Wang, Wei Liu, Weibo Gu +2

Robotics & Embodied AI Training Efficiency & Optimization

Mar 9, 2026

Weining Ren +2Mar 9, 2026·also Baidu

Speed3R: Sparse Feed-forward 3D Reconstruction Models

Achieve a remarkable 12.4x speedup in 3D reconstruction by mimicking the efficiency of keypoint matching with a novel dual-branch attention mechanism.

Weining Ren, Xiao Tan, Kai Han

Architecture Design (Transformers, SSMs, MoE)Computer Vision Training Efficiency & Optimization

Mar 2, 2026

Wenye Lin +1Mar 2, 2026

Surgical Post-Training: Cutting Errors, Keeping Knowledge

Forget expensive, full-parameter fine-tuning: surgically correcting just 4k errors in LLM reasoning boosts accuracy by 6.2% while preserving prior knowledge.

Wenye Lin, Kai Han

RLHF & Preference Learning Training Efficiency & Optimization

Search

Kai Han

Research focus

Frequent co-authors

Papers (3)