Zheng Lin

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Chenxu Yang (1)Chuanyu Qin (1)Qingyi Si (1)Minghui Chen (1)

Papers (1)

Apr 3, 2026

Chenxu Yang +93w ago

Self-Distilled RLVR

Self-distillation in LLMs can leak information and destabilize training, but combining it with verifiable rewards yields a sweet spot for improved convergence and stability.

Chenxu Yang, Chuanyu Qin, Qingyi Si +7

Inference & Quantization RLHF & Preference Learning Training Efficiency & Optimization

Search

Zheng Lin

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)