Cong Qin

Meituan, Peking University {fuxiaoliang04, linjiaye, fangyangyi}@meituan.com

Papers on Lattice

Total citations

Topics

Research focus

Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Xiaoliang Fu (1)Jiaye Lin (1)Yangyi Fang (1)Binbin Zheng (1)

Papers (1)

Feb 19, 2026

Feb 19, 2026·also Baidu, Meituan, PKU, USTC

MASPO: Unifying Gradient Utilization, Probability Mass, and Signal Reliability for Robust and Sample-Efficient LLM Reasoning

LLM reasoning gets a serious upgrade with MASPO, a new RLVR method that smartly balances gradient use, probability mass, and signal reliability for faster, more robust learning.

Xiaoliang Fu, Jiaye Lin, Yangyi Fang +4

Reasoning & Chain-of-Thought RLHF & Preference Learning Training Efficiency & Optimization

Search

Cong Qin

Research focus

Frequent co-authors

Papers (1)