Ruijie Zhang

Papers on Lattice

Total citations

Topics

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Training Efficiency & Optimization (2)

Frequent co-authors

Yequan Zhao (1)Ziyue Liu (1)Zhengyang Wang (1)

Papers (2)

Mar 30, 2026

Ruijie ZhangMar 30, 2026

MuonEq: Balancing Before Orthogonalization with Lightweight Equilibration

Row/column normalization *before* orthogonalization can significantly boost convergence and reduce validation perplexity in LLaMA2 pretraining, outperforming the base Muon optimizer.

Ruijie Zhang

Architecture Design (Transformers, SSMs, MoE)Training Efficiency & Optimization

Feb 25, 2026

Feb 25, 2026·also University

Muon+: Towards Better Muon via One Additional Normalization Step

A single normalization step turns Muon into Muon+, delivering consistent perplexity improvements in LLM pre-training.

Ruijie Zhang, Yequan Zhao, Ziyue Liu +1

Architecture Design (Transformers, SSMs, MoE)Training Efficiency & Optimization

Search

Ruijie Zhang

Research focus

Frequent co-authors

Papers (2)