Mengqi He

Australian National University

Papers on Lattice

Total citations

Topics

h-index

Research focus

Multimodal Models (1)Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)

Frequent co-authors

Xinyu Tian (1)Zhaoyuan Yang (1)Peter Tu (1)

Papers (1)

Apr 1, 2026

Apr 1, 2026·also Shanghai AI Lab

All Roads Lead to Rome: Incentivizing Divergent Thinking in Vision-Language Models

RL's success in boosting VLM reasoning hides a critical flaw: it crushes the model's ability to explore diverse solutions, leading to premature convergence and hindering scalability.

Xinyu Tian, Zhaoyuan Yang, Mengqi He +1

Multimodal Models Reasoning & Chain-of-Thought RLHF & Preference Learning

Search

Mengqi He

Research focus

Frequent co-authors

Papers (1)