Qi Han

Papers on Lattice

Total citations

347

Topics

h-index

Research focus

Open-Source Models & Weights (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Jingcheng Hu (1)Yinmin Zhang (1)Daxin Jiang (1)Xiangyu Zhang (1)

Papers (1)

Mar 31, 2025

Jingcheng Hu +5Mar 31, 2025·also Tsinghua AI

Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model

Forget complex RLHF pipelines: simple PPO with rule-based rewards can outperform state-of-the-art reasoning models while slashing training costs by 90%.

Jingcheng Hu, Yinmin Zhang, Qi Han +3347

Open-Source Models & Weights RLHF & Preference Learning Training Efficiency & Optimization

Search

Qi Han

Research focus

Frequent co-authors

Papers (1)