Zhipeng Chen

Gaoling School of Artificial Intelligence, Renmin University of China.

Papers on Lattice

Total citations

Topics

Research focus

RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Tao Qian (1)Wayne Xin Zhao (1)Ji-Rong Wen (1)

Papers (1)

Apr 13, 2026

Apr 13, 2026·also China University of Mining and Technology

Low-rank Optimization Trajectories Modeling for LLM RLVR Acceleration

LLMs' training trajectories in RLVR are more predictable than you think: modeling the non-linear evolution of a rank-1 subspace lets you extrapolate parameters and cut compute by 37.5%.

Zhipeng Chen, Tao Qian, Wayne Xin Zhao +1

RLHF & Preference Learning Training Efficiency & Optimization

Search

Zhipeng Chen

Research focus

Frequent co-authors

Papers (1)