Yufei Zhang

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (2)Robotics & Embodied AI (1)Distributed Systems & Hardware (1)RLHF & Preference Learning (1)

Frequent co-authors

David Šiška (1)Tianhao Hu (1)Xiangcheng Liu (1)Youshao Xiao (1)

Papers (2)

May 21, 2026

David Šiška +1May 21, 2026

A note on convergence of Wasserstein policy optimization

WPO, a promising RL algorithm for continuous control, is now proven to converge linearly, finally putting it on solid theoretical footing.

David Šiška, Yufei Zhang

Robotics & Embodied AI Training Efficiency & Optimization

Apr 29, 2026

Tianhao Hu +14Apr 29, 2026

DORA: A Scalable Asynchronous Reinforcement Learning System for Language Model Training

Asynchronous RL for LLMs doesn't have to sacrifice convergence for speed: DORA achieves 2-4x faster training by cleverly managing multiple policy versions during rollout.

Tianhao Hu, Xiangcheng Liu, Youshao Xiao +12

Distributed Systems & Hardware RLHF & Preference Learning Training Efficiency & Optimization

Search

Yufei Zhang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)