Shuo Hou

Xi'an Jiaotong University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Constitutional AI & AI Ethics (1)RLHF & Preference Learning (1)

Frequent co-authors

Xuekang Wang (1)Zhuoyuan Hao (1)Hao Peng (1)Juanzi Li (1)

Papers (1)

Jun 3, 2026

Tsinghua AI3w ago·also HIT, XJTU

Reproducing, Analyzing, and Detecting Reward Hacking in Rubric-Based Reinforcement Learning

Reward hacking in rubric-based RL is not just common; it can be systematically reproduced and analyzed using the new CHERRL environment, revealing hidden biases that could compromise training integrity.

Xuekang Wang, Zhuoyuan Hao, Shuo Hou +3

Constitutional AI & AI Ethics RLHF & Preference Learning

Search

Shuo Hou

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)