Xiaoxia Wu

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Training Efficiency & Optimization (1)

Frequent co-authors

Zhongzhu Zhou (1)Fengxiang Bie (1)Ziyan Chen (1)Zhenyu Zhang (1)

Papers (1)

Mar 18, 2026

Zhongzhu Zhou +82w ago·also BUPT

CARE: Covariance-Aware and Rank-Enhanced Decomposition for Enabling Multi-Head Latent Attention

Forget SVD: CARE aligns low-rank attention approximations with input activations, boosting accuracy up to 1.7x and slashing perplexity by 215x when converting models to multi-head latent attention.

Zhongzhu Zhou, Fengxiang Bie, Ziyan Chen +6

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Xiaoxia Wu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)