Mengdi Wang

State Key Lab of Processors, Institute of Computing Technology, Chinese Academy of Sciences

Papers on Lattice

Total citations

Topics

h-index

Research focus

Data Curation & Synthetic Data (1)RLHF & Preference Learning (1)

Frequent co-authors

Xuan Qi (1)Jiahao Qiu (1)Xinzhe Juan (1)Yue Wu (1)

Papers (1)

May 21, 2025

May 21, 2025·also CAS

Shallow Preference Signals: Large Language Model Aligns Even Better with Truncated Data?

LLMs align even better with human preferences when trained on *less* data, revealing that preference signals are surprisingly concentrated in the initial tokens of responses.

Xuan Qi, Jiahao Qiu, Xinzhe Juan +2

Data Curation & Synthetic Data RLHF & Preference Learning

Search

Mengdi Wang

Research focus

Frequent co-authors

Papers (1)