Weibo Gu

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (1)RLHF & Preference Learning (1)Robotics & Embodied AI (1)Training Efficiency & Optimization (1)

Frequent co-authors

Zican Hu (1)Xuyang Hu (1)Yiming Liu (1)Zuwei Long (1)

Papers (2)

Jul 4, 2026

UW1w ago

Bridging Interleaved Multi-Modal Reasoning as a Unified Decision Process

A unified decision process for multi-modal reasoning reveals that joint optimization of text and image generation can dramatically enhance performance in complex reasoning tasks.

Zican Hu, Xuyang Hu, Yiming Liu +9

Multimodal Models RLHF & Preference Learning

Mar 14, 2026

Hongjun Wang +4Mar 14, 2026

MHPO: Modulated Hazard-aware Policy Optimization for Stable Reinforcement Learning

Stabilizing RL training is now possible by modulating importance ratios with hazard-aware penalties, preventing both mode collapse and policy erosion.

Hongjun Wang, Wei Liu, Weibo Gu +2

Robotics & Embodied AI Training Efficiency & Optimization

Search

Weibo Gu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)