Weiping Wang

Papers on Lattice

Total citations

Topics

h-index

Research focus

Inference & Quantization (2)Training Efficiency & Optimization (2)RLHF & Preference Learning (1)

Frequent co-authors

Naibin Gu (2)Chenxu Yang (2)Qingyi Si (2)Chuanyu Qin (2)

Papers (2)

Apr 29, 2026

Co-Evolving Policy Distillation

By co-evolving experts through bidirectional policy distillation, CoPD achieves all-in-one integration of text, image, and video reasoning, outperforming domain-specific experts and suggesting a new training paradigm.

Naibin Gu, Chenxu Yang, Qingyi Si +7

Inference & Quantization Training Efficiency & Optimization

Apr 3, 2026

Chenxu Yang +9Apr 3, 2026

Self-Distilled RLVR

Self-distillation in LLMs can leak information and destabilize training, but combining it with verifiable rewards yields a sweet spot for improved convergence and stability.

Chenxu Yang, Chuanyu Qin, Qingyi Si +7

Inference & Quantization RLHF & Preference Learning Training Efficiency & Optimization

Search

Weiping Wang

Research focus

Frequent co-authors

Papers (2)