Xing Sun

Papers on Lattice

Total citations

Topics

h-index

Research focus

Robotics & Embodied AI (1)Training Efficiency & Optimization (1)

Frequent co-authors

Hongjun Wang (1)Wei Liu (1)Weibo Gu (1)Kai Han (1)

Papers (1)

Mar 14, 2026

Hongjun Wang +4Mar 14, 2026

MHPO: Modulated Hazard-aware Policy Optimization for Stable Reinforcement Learning

Stabilizing RL training is now possible by modulating importance ratios with hazard-aware penalties, preventing both mode collapse and policy erosion.

Hongjun Wang, Wei Liu, Weibo Gu +2

Robotics & Embodied AI Training Efficiency & Optimization

Search

Xing Sun

Research focus

Frequent co-authors

Papers (1)