Ruopei Sun

Papers on Lattice

Total citations

Topics

h-index

Research focus

Natural Language Processing (2)RLHF & Preference Learning (2)Constitutional AI & AI Ethics (1)

Frequent co-authors

Jianfeng Cai (2)Jinhua Zhu (2)Weng Zhou (2)Li Li (2)

Papers (2)

May 19, 2025

May 19, 2025·also Cohere

Multi-Level Aware Preference Learning: Enhancing RLHF for Complex Multi-Instruction Tasks

RLHF can be significantly improved for complex tasks by explicitly modeling preference relationships both within and between training examples, unlocking better instruction following without relying on expensive human annotation or biased LLM-generated data.

Ruopei Sun, Jianfeng Cai, Jinhua Zhu +5

Natural Language Processing RLHF & Preference Learning

Feb 2, 2025

Feb 2, 2025·also Cohere

Disentangling Length Bias In Preference Learning Via Response-Conditioned Modeling

RLHF reward models can be made significantly less susceptible to length bias by explicitly modeling and disentangling semantic preferences from length requirements.

Jianfeng Cai, Jinhua Zhu, Ruopei Sun +4

Constitutional AI & AI Ethics Natural Language Processing RLHF & Preference Learning

Search

Ruopei Sun

Research focus

Frequent co-authors

Papers (2)