Hongzhan Chen

Papers on Lattice

Total citations

Topics

h-index

Research focus

RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Shiping Gao (1)Xiaojun Quan (1)Qifan Wang (1)

Papers (1)

Apr 14, 2026

Shiping Gao +3Apr 14, 2026

Unleashing Implicit Rewards: Prefix-Value Learning for Distribution-Level Optimization

Implicit reward models can now more accurately pinpoint correct reasoning steps, thanks to a novel prefix-value learning approach that closes the train-inference gap.

Shiping Gao, Hongzhan Chen, Xiaojun Quan +1

RLHF & Preference Learning Training Efficiency & Optimization

Search

Hongzhan Chen

Research focus

Frequent co-authors

Papers (1)