Tong Zheng

University of Maryland

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Training Efficiency & Optimization (1)Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)

Frequent co-authors

Weiqiao Shan (1)Ruixiang Mao (1)Yuang Li (1)Yuhao Zhang (1)

Papers (2)

Jun 15, 2026

4d ago·also Ant Group, CUHK, Harbin Engineering University, Huawei +2

SPRI: SVD-Partitioned Residual Initialization for Data-Constrained MoE Upcycling

SPRI achieves a remarkable 3.39 BLEU point improvement over the best existing MoE upcycling method, demonstrating that pretrained weight structures can be effectively leveraged for better expert diversity.

Weiqiao Shan, Ruixiang Mao, Yuang Li +10

Architecture Design (Transformers, SSMs, MoE)Training Efficiency & Optimization

Jun 2, 2026

2w ago·also Jilin, UMD

Small RL Controller, Large Language Model: RL-Guided Adaptive Sampling for Test-Time Scaling

Reinforcement learning can significantly enhance adaptive sampling in large language models, leading to better performance with fewer resources.

Runpeng Dai, Runpeng Dai, Tong Zheng +4

Reasoning & Chain-of-Thought RLHF & Preference Learning Scaling Laws & Emergent Abilities

Search

Tong Zheng

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)