Xue Wang

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (3)Natural Language Processing (2)Architecture Design (Transformers, SSMs, MoE) (2)Scaling Laws & Emergent Abilities (1)

Frequent co-authors

Jialin Gan (1)Jialin Gan (1)Xin Qiu (1)Guang-Ze Chen (1)

Papers (3)

Jun 11, 2026

Jialin Gan +5Jun 11, 2026·also Graduate School of Advanced Science and Engineering

Beyond Uniform Tokens: Adaptive Compression for Time Series Language Models

Time series language models can achieve up to 7.68× faster inference and improved performance by intelligently compressing tokens based on their information structure.

Jialin Gan, Jialin Gan, Xin Qiu +3

Natural Language Processing Scaling Laws & Emergent Abilities Training Efficiency & Optimization

Apr 21, 2026

Corresponding authorApr 21, 2026

FG$^2$-GDN: Enhancing Long-Context Gated Delta Networks with Doubly Fine-Grained Control

Channel-wise adaptive learning rates in Gated Delta Networks unlock superior long-context recall, rivaling softmax attention without the quadratic cost.

Pingwei Sun, Jianchao Tan, Xue Wang +3

Architecture Design (Transformers, SSMs, MoE)Natural Language Processing Training Efficiency & Optimization

Feb 26, 2026

Accelerating LLM Pre-Training through Flat-Direction Dynamics Enhancement

By strategically amplifying updates along flat directions in the loss landscape, LITE unlocks faster LLM pre-training with existing matrix-based optimizers like Muon and SOAP.

Shuchen Zhu, Shuchen Zhu, Mingze Wang +6

Architecture Design (Transformers, SSMs, MoE)Training Efficiency & Optimization

Search

Xue Wang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)