Peng Fu

Institute of Information Engineering, Chinese Academy of Sciences

Papers on Lattice

Total citations

Topics

h-index

Research focus

Training Efficiency & Optimization (2)Inference & Quantization (1)RLHF & Preference Learning (1)

Frequent co-authors

Naibin Gu (2)Chenxu Yang (2)Qingyi Si (2)Chuanyu Qin (2)

Papers (2)

Apr 29, 2026

Co-Evolving Policy Distillation

By co-evolving experts through bidirectional policy distillation, CoPD achieves all-in-one integration of text, image, and video reasoning, outperforming domain-specific experts and suggesting a new training paradigm.

Naibin Gu, Chenxu Yang, Qingyi Si +7

Inference & Quantization Training Efficiency & Optimization

Apr 22, 2026

Apr 22, 2026·also BAAI

Near-Future Policy Optimization

Forget external teachers – the best way to boost your RL model's performance is to learn from its future self.

Chuanyu Qin, Chenxu Yang, Chen Yang +9

RLHF & Preference Learning Training Efficiency & Optimization

Search

Peng Fu

Research focus

Frequent co-authors

Papers (2)