Yansong Feng

Peking University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (2)RLHF & Preference Learning (1)Natural Language Processing (1)Scaling Laws & Emergent Abilities (1)

Frequent co-authors

Chengjun Pan (1)Shichun Liu (1)Jiahang Lin (1)Dingwei Zhu (1)

Papers (2)

Apr 21, 2026

1w ago·also Fudan, Shanghai AI Lab, Shanghai Qiji Zhifeng Co.

EVPO: Explained Variance Policy Optimization for Adaptive Critic Utilization in LLM Post-Training

Learned critics in RLHF can actually *increase* variance and hurt performance in sparse-reward settings, but a simple explained variance metric can tell you when to ditch the critic and get better results.

Chengjun Pan, Shichun Liu, Jiahang Lin +8

RLHF & Preference Learning Training Efficiency & Optimization

Apr 20, 2026

Adelaide University1w ago·also PKU

Efficient Low-Resource Language Adaptation via Multi-Source Dynamic Logit Fusion

TriMix reveals that prioritizing small, specialized models can dramatically improve low-resource language adaptation, overturning the assumption that bigger models always lead the way.

Chen Zhang, Jiuheng Lin, Zhiyuan Liao +1

Natural Language Processing Scaling Laws & Emergent Abilities Training Efficiency & Optimization

Search

Yansong Feng

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)