Latticethe structure behind the noise

Papers Digest Topics Selected Labs Collections FAQ

Created by Flynn Lachendro

Papers Digest Topics Labs Saved

Search

Search papers, labs, and topics across Lattice.

Built by Flynn Lachendro·𝕏 / Twitter·RSS··FAQ·Glossary·Privacy

Nan Duan | Lattice

Nan Duan

Papers on Lattice

2

Total citations

0

Topics

3

h-index

7

Publication activitypapers/week, last 8 weeks

Research focus

RLHF & Preference Learning (2)Training Efficiency & Optimization (2)Inference & Quantization (1)

Frequent co-authors

Chuanyu Qin (2)Qingyi Si (2)Naibin Gu (2)Dingyu Yao (2)

Papers (2)

Apr 22, 2026

3d ago·also BAAI

Near-Future Policy Optimization

Forget external teachers – the best way to boost your RL policy might be learning from its future self.

Chuanyu Qin, Chenxu Yang, Chen Yang +9

RLHF & Preference Learning Training Efficiency & Optimization

Apr 3, 2026

Chenxu Yang +93w ago

Self-Distilled RLVR

Self-distillation in LLMs can leak information and destabilize training, but combining it with verifiable rewards yields a sweet spot for improved convergence and stability.

Chenxu Yang, Chuanyu Qin, Qingyi Si +7

Inference & Quantization RLHF & Preference Learning Training Efficiency & Optimization

Jiaqi Wang (2)

Chenxu Yang (1)