Xuhui Zheng

Papers on Lattice

Total citations

Topics

h-index

Research focus

RLHF & Preference Learning (1)Scalable Oversight & Alignment Theory (1)

Frequent co-authors

Feiyu Wu (1)Xu Zheng (1)Zhuocheng Wang (1)Zhuochen Wang (1)

Papers (1)

Apr 30, 2026

Feiyu Wu +6Apr 30, 2026·also HKUST, Xidian

RHyVE: Competence-Aware Verification and Phase-Aware Deployment for LLM-Generated Reward Hypotheses

LLM-generated rewards in RL can be misleading early in training, but RHyVE dynamically selects the best reward signal based on policy competence, leading to improved performance.

Feiyu Wu, Xuhui Zheng, Xu Zheng +4

RLHF & Preference Learning Scalable Oversight & Alignment Theory

Search

Xuhui Zheng

Research focus

Frequent co-authors

Papers (1)