Hongtao Xu

University of Chinese Academy of Sciences, Meituan

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Training Efficiency & Optimization (1)

Frequent co-authors

Jianchao Tan (1)Yuxuan Hu (1)Pengju Lu (1)Hongyu Wang (1)

Papers (1)

Apr 15, 2026

1w ago·also Corresponding author, Meituan

SparseBalance: Load-Balanced Long Context Training with Dynamic Sparse Attention

Training long-context sparse attention models doesn't have to be a slow, imbalanced mess: SparseBalance achieves 1.33x speedup while *improving* accuracy.

Hongtao Xu, Jianchao Tan, Yuxuan Hu +8

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

Search

Hongtao Xu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)