Tingyu Xia

Papers on Lattice

Total citations

Topics

h-index

Research focus

Natural Language Processing (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Gengxu Li (1)Yi Chang (1)Yuan Wu (1)

Papers (1)

Feb 20, 2025

Gengxu Li +3Feb 20, 2025

Length-Controlled Margin-Based Preference Optimization without Reference Model

Tired of DPO's length bias and probability degradation? LMPO offers a more robust and efficient alternative for preference-based RLHF, outperforming existing methods on Mistral and LLaMA3.

Gengxu Li, Tingyu Xia, Yi Chang +1

Natural Language Processing RLHF & Preference Learning Training Efficiency & Optimization

Search

Tingyu Xia

Research focus

Frequent co-authors

Papers (1)