Yang Zheng

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (2)Distributed Systems & Hardware (1)RLHF & Preference Learning (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Tianhao Hu (1)Xiangcheng Liu (1)Youshao Xiao (1)Xuan Huang (1)

Papers (2)

Apr 29, 2026

Tianhao Hu +14Apr 29, 2026

DORA: A Scalable Asynchronous Reinforcement Learning System for Language Model Training

Asynchronous RL for LLMs doesn't have to sacrifice convergence for speed: DORA achieves 2-4x faster training by cleverly managing multiple policy versions during rollout.

Tianhao Hu, Xiangcheng Liu, Youshao Xiao +12

Distributed Systems & Hardware RLHF & Preference Learning Training Efficiency & Optimization

Apr 1, 2026

Apr 1, 2026·also RayNeo.AI

Fast and Accurate Probing of In-Training LLMs' Downstream Performances

Skip the costly generative evals: a simple probe trained on internal LLM representations can accurately predict downstream task performance during training, slashing evaluation time from an hour to just three minutes.

Zhichen Liu, Tianle Lun, Yulin Ou +4

Eval Frameworks & Benchmarks Scaling Laws & Emergent Abilities Training Efficiency & Optimization

Search

Yang Zheng

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)