Junjie Yan

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Open-Source Models & Weights (1)Tool Use & Agents (1)Training Efficiency & Optimization (1)

Frequent co-authors

MiniMax (1)Aili Chen (1)Aonian Li (1)Baichuan Zhou (1)

Papers (2)

May 26, 2026

MiniMax +1763w ago·also Columbia, Fudan, HFUT, HIT +11

The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence

MiniMax-M2 proves that massive parameter counts don't always translate to better agentic performance; strategic activation of a smaller subset can unlock frontier-level intelligence.

MiniMax, Aili Chen, Aonian Li +174

Architecture Design (Transformers, SSMs, MoE)Open-Source Models & Weights Tool Use & Agents

Mar 16, 2026

Mar 16, 2026·also Cohere, Moonshot, UCSD

Attention Residuals

Forget fixed residual connections: Attention Residuals let each layer selectively attend to previous layers, boosting performance and gradient flow in deep LLMs.

Kimi Team, Jianlin Su, Weixin Xu +28

Architecture Design (Transformers, SSMs, MoE)Training Efficiency & Optimization

Search

Junjie Yan

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)