Xunhao Lai

MiniMax, Peking University

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Scaling Laws & Emergent Abilities (1)

Frequent co-authors

Weiqi Xu (1)Yufeng Yang (1)Qiaorui Chen (1)Yangyifan Xu (1)

Papers (1)

Jun 11, 2026

1w ago·also NVIDIA, HIT, HUST, PKU +1

MiniMax Sparse Attention

MSA slashes per-token attention compute by over 28x while maintaining competitive performance, revolutionizing how LLMs can handle ultra-long contexts.

Xunhao Lai, Weiqi Xu, Yufeng Yang +9

Architecture Design (Transformers, SSMs, MoE)Scaling Laws & Emergent Abilities

Search

Xunhao Lai

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)