Latticethe structure behind the noise

Papers Digest Topics Selected Labs Collections FAQ

Created by Flynn Lachendro

Papers Digest Topics Labs Saved

Search

Search papers, labs, and topics across Lattice.

Built by Flynn Lachendro·𝕏 / Twitter·RSS··FAQ·Glossary·Privacy

Zhihong Chen | Lattice

Zhihong Chen

Papers on Lattice

1

Total citations

9

Topics

2

h-index

19

Research focus

RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Yuhao Du (1)Zhuo Li (1)Pengyu Cheng (1)Yuejiao Xie (1)

Papers (1)

Feb 16, 2025

Yuhao Du +6Feb 16, 2025

Simplify RLHF as Reward-Weighted SFT: A Variational Method

Ditch the RLHF complexity: a variational re-weighting approach turns alignment into stable, reward-driven SFT, rivaling existing methods.

Yuhao Du, Zhuo Li, Pengyu Cheng +49

RLHF & Preference Learning Training Efficiency & Optimization

Xiang Wan (1)

Anningzhe Gao (1)