Yangyang Ren

Papers on Lattice

Total citations

Topics

Research focus

Inference & Quantization (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Yanjing Li (1)Mingbao Lin (1)Xuhui Liu (1)Xiantong Zhen (1)

Papers (1)

Mar 4, 2026

Unbiased Dynamic Pruning for Efficient Group-Based Policy Optimization

Achieve over 2x training speedup for LLM reasoning without sacrificing accuracy by dynamically pruning Group Relative Policy Optimization (GRPO) with a novel importance sampling correction.

Yangyang Ren, Yanjing Li, Mingbao Lin +3

Inference & Quantization RLHF & Preference Learning Training Efficiency & Optimization

Search

Yangyang Ren

Research focus

Frequent co-authors

Papers (1)