Weiqi Xu

MiniMax

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Scaling Laws & Emergent Abilities (1)

Frequent co-authors

Xunhao Lai (1)Yufeng Yang (1)Qiaorui Chen (1)Yangyifan Xu (1)

Papers (1)

Jun 11, 2026

6d ago·also NVIDIA, HIT, HUST, PKU +2

MiniMax Sparse Attention

MSA slashes per-token attention compute by over 28x while maintaining competitive performance, revolutionizing how LLMs can handle ultra-long contexts.

Xunhao Lai, Weiqi Xu, Yufeng Yang +9

Architecture Design (Transformers, SSMs, MoE)Scaling Laws & Emergent Abilities

Search

Weiqi Xu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)