Zhihong Zhang

University of Science and Technology of China

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Data Curation & Synthetic Data (1)Multimodal Models (1)RLHF & Preference Learning (1)

Frequent co-authors

Jie Zhao (1)Xiaojian Huang (1)Jin Xu (1)Zhuodong Luo (1)

Papers (1)

Apr 21, 2026

4d ago·also Manuscript received April 21

DT2IT-MRM: Debiased Preference Construction and Iterative Training for Multimodal Reward Modeling

Noisy multimodal preference datasets are holding back reward model performance, but DT2IT-MRM offers a scalable curation strategy that achieves state-of-the-art results.

Zhihong Zhang, Jie Zhao, Xiaojian Huang +5

Data Curation & Synthetic Data Multimodal Models RLHF & Preference Learning

Search

Zhihong Zhang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)