Kai Shen

Peking University

Papers on Lattice

Total citations

Topics

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Scaling Laws & Emergent Abilities (1)Training Efficiency & Optimization (1)

Frequent co-authors

Mingze Wang (1)Shuchen Zhu (1)Yuxin Fang (1)Binghui Li (1)

Papers (1)

May 26, 2026

Negligible in Size, Significant in Effect: On Scale Vectors in Large Language Models

Scale vectors, despite being a tiny fraction of LLM parameters, are critical for pre-training, and this paper unlocks how to make them even better with simple, theoretically-grounded tweaks.

Mingze Wang, Shuchen Zhu, Yuxin Fang +2

Architecture Design (Transformers, SSMs, MoE)Scaling Laws & Emergent Abilities Training Efficiency & Optimization

Search

Kai Shen

Research focus

Frequent co-authors

Papers (1)