Yuzhang Shang

Papers on Lattice

Total citations

Topics

h-index

Research focus

Computer Vision (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Xinxing Liu (1)Xinxin Liu (1)Ming Li (1)Zonglin Lyu (1)

Papers (1)

Apr 27, 2026

Apr 27, 2026·also NJU

Learning from Noisy Preferences: A Semi-Supervised Learning Approach to Direct Preference Optimization

Compressing multi-dimensional human preferences into single binary labels severely degrades DPO training, but a semi-supervised approach can recover state-of-the-art performance without additional human annotation.

Xinxing Liu, Xinxin Liu, Ming Li +3

Computer Vision RLHF & Preference Learning Training Efficiency & Optimization

Search

Yuzhang Shang

Research focus

Frequent co-authors

Papers (1)