Chen Chen

Papers on Lattice

Total citations

Topics

h-index

Research focus

RLHF & Preference Learning (3)Multimodal Models (2)Training Efficiency & Optimization (2)Computer Vision (2)Robotics & Embodied AI (1)

Frequent co-authors

Ming Li (2)Sudong Wang (1)Weiquan Huang (1)Xiaomin Yu (1)

Papers (3)

Apr 30, 2026

Apr 30, 2026·also Tsinghua AI

Beyond SFT-to-RL: Pre-alignment via Black-Box On-Policy Distillation for Multimodal RL

Stop letting SFT ruin your LMMs: PRISM uses on-policy distillation to realign your model *before* RL, boosting performance by up to 6%.

Sudong Wang, Weiquan Huang, Xiaomin Yu +10

Multimodal Models RLHF & Preference Learning Robotics & Embodied AI+1

Apr 27, 2026

Apr 27, 2026·also UCF

Learning from Noisy Preferences: A Semi-Supervised Learning Approach to Direct Preference Optimization

Compressing multi-dimensional human preferences into single binary labels severely degrades DPO training, but a semi-supervised approach can recover state-of-the-art performance without additional human annotation.

Xinxin Liu, Xinxing Liu, Ming Li +3

Computer Vision RLHF & Preference Learning Training Efficiency & Optimization

Apr 27, 2026·also ByteDance

ViPO: Visual Preference Optimization at Scale

Scaling visual preference optimization hinges on data quality, as a massive, high-resolution dataset renders complex optimization algorithms unnecessary.

Ming Li, Jie Wu, J. Cui +4

Computer Vision Multimodal Models RLHF & Preference Learning

Search

Chen Chen

Research focus

Frequent co-authors

Papers (3)