Wendi Li

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Sharon Li (1)

Papers (1)

Feb 23, 2026

3w ago

LAD: Learning Advantage Distribution for Reasoning

Ditch reward maximization: a new RL objective learns the *distribution* of reasoning advantages, boosting LLM accuracy and diversity without extra training costs.

Wendi Li, Sharon Li

Reasoning & Chain-of-Thought RLHF & Preference Learning Training Efficiency & Optimization

Search

Wendi Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)