Yuechen Wang

Papers on Lattice

Total citations

Topics

h-index

Research focus

Constitutional AI & AI Ethics (1)Natural Language Processing (1)RLHF & Preference Learning (1)

Frequent co-authors

Jianfeng Cai (1)Jinhua Zhu (1)Ruopei Sun (1)Li Li (1)

Papers (1)

Feb 2, 2025

Feb 2, 2025·also Cohere

Disentangling Length Bias In Preference Learning Via Response-Conditioned Modeling

RLHF reward models can be made significantly less susceptible to length bias by explicitly modeling and disentangling semantic preferences from length requirements.

Jianfeng Cai, Jinhua Zhu, Ruopei Sun +4

Constitutional AI & AI Ethics Natural Language Processing RLHF & Preference Learning

Search

Yuechen Wang

Research focus

Frequent co-authors

Papers (1)