Huixin Wang

Papers on Lattice

Total citations

Topics

h-index

Research focus

Multimodal Models (2)RLHF & Preference Learning (2)Robotics & Embodied AI (1)Computer Vision (1)

Frequent co-authors

Zihao Chen (2)Ya-Qi Yu (1)Fang Hong (1)Xiangyan Qu (1)

Papers (2)

May 28, 2026

Ya-Qi Yu +15May 28, 2026·also Edinburgh, Imperial, MBZUAI, NTU +1

Reinforcement Learning with Robust Rubric Rewards

Forget hand-crafted reward functions: $\text{RLR}^3$ leverages rubrics and LLMs to provide fine-grained, multi-criteria supervision, outperforming standard RLVR in vision-language tasks.

Ya-Qi Yu, Fang Hong, Xiangyan Qu +13

Multimodal Models RLHF & Preference Learning Robotics & Embodied AI

Apr 14, 2026

Apr 14, 2026·also Shanghai Conservatory of Music

Visual Preference Optimization with Rubric Rewards

Fine-grained rubrics unlock significantly better visual reasoning in preference optimization, rivaling GPT-5.4 with a much smaller model.

Fangyu Hong, Xiangyang Qu, Huixin Wang +3

Computer Vision Multimodal Models RLHF & Preference Learning

Search

Huixin Wang

Research focus

Frequent co-authors

Papers (2)