Latticethe structure behind the noise

Papers Digest Topics Selected Labs Collections FAQ

Created by Flynn Lachendro

Papers Digest Topics Labs Saved

Search

Search papers, labs, and topics across Lattice.

Built by Flynn Lachendro·𝕏 / Twitter·RSS··FAQ·Glossary·Privacy

Guofeng Quan | Lattice

Guofeng Quan

Papers on Lattice

1

Total citations

0

Topics

2

Publication activitypapers/week, last 8 weeks

Research focus

RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Guochao Jiang (1)Jingyi Song (1)Chuzhan Hao (1)Guohua Liu (1)

Papers (1)

May 25, 2026

DAMO3w ago

DVAO: Dynamic Variance-adaptive Advantage Optimization for Multi-reward Reinforcement Learning

Forget static hyperparameters: DVAO dynamically adjusts reward weights based on variance, leading to more stable and effective multi-objective RLHF.

Guochao Jiang, Jingyi Song, Guofeng Quan +3

RLHF & Preference Learning Training Efficiency & Optimization

Yuewei Zhang (1)