Wei Chen

Li Auto Inc, Li Auto, Kuaishou Technology, Dongmyoung Lee, Wei Chen, Xiaoshuai Chen, Rui Zong, and Petar Kormushev are with the Robot Intelligence Lab, Dyson School of Design Engineering, Imperial College London, 25 Exhibition Road, London, SW7 2DB, UK (d.lee20, w.chen21, c.xiaoshuai19, rui.zong21, p.kormushev)@imperial.ac.uk

Papers on Lattice

Total citations

Topics

h-index

Research focus

Data Curation & Synthetic Data (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Qi Lin (1)Hengtong Lu (1)Caixia Yuan (1)Xiaojie Wang (1)

Papers (1)

Apr 11, 2025

Apr 11, 2025·also Imperial, Kuaishou, Li Auto

Data with High and Consistent Preference Difference Are Better for Reward Model

Stop wasting compute on noisy preference data: filtering your RLHF datasets by "Preference Difference" boosts reward model accuracy and alignment performance.

Qi Lin, Hengtong Lu, Caixia Yuan +3

Data Curation & Synthetic Data RLHF & Preference Learning Training Efficiency & Optimization

Search

Wei Chen

Research focus

Frequent co-authors

Papers (1)