Hao Wang

Papers on Lattice

Total citations

Topics

h-index

Research focus

RLHF & Preference Learning (1)

Frequent co-authors

Licheng Pan (1)Zhichao Chen (1)Chunyuan Zheng (1)Zhixuan Chu (1)

Papers (1)

Mar 19, 2026

Hao Wang +8Mar 19, 2026

CausalRM: Causal-Theoretic Reward Modeling for RLHF from Observational User Feedbacks

Observational user feedback, often dismissed as too noisy and biased, can actually power effective RLHF with the right causal modeling, achieving a 49.2% gain on WildGuardMix.

Hao Wang, Licheng Pan, Zhichao Chen +6

RLHF & Preference Learning

Search

Hao Wang

Research focus

Frequent co-authors

Papers (1)