Ningyuan Yang

CMU Machine Learning

Papers on Lattice

Total citations

Topics

Research focus

Data Curation & Synthetic Data (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Weihua Du (1)Weiwei Sun (1)Sean Welleck (1)Yiming Yang (1)

Papers (1)

Feb 25, 2026

CMU MLFeb 25, 2026·also Fudan, UBC

GradAlign: Gradient-Aligned Data Selection for LLM Reinforcement Learning

Forget manual curation—aligning policy gradients with a validation set adaptively selects RL training data, leading to more stable LLM training and improved performance.

Ningyuan Yang, Weihua Du, Weiwei Sun +2

Data Curation & Synthetic Data RLHF & Preference Learning Training Efficiency & Optimization

Search

Ningyuan Yang

Research focus

Frequent co-authors

Papers (1)