Shuxia Lin

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Natural Language Processing (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Miaosen Zhang (1)Yishan Liu (1)Xu Yang (1)Qi Dai (1)

Papers (1)

Feb 12, 2026

Towards On-Policy SFT: Distribution Discriminant Theory and its Applications in LLM Training

SFT can match the generalization performance of offline RL methods like DPO, thanks to a new theory that aligns training data with the model's distribution.

Miaosen Zhang, Yishan Liu, Shuxia Lin +5

Natural Language Processing RLHF & Preference Learning Training Efficiency & Optimization

Search

Shuxia Lin

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)