Jianye Hao

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Robotics & Embodied AI (2)Training Efficiency & Optimization (2)Reasoning & Chain-of-Thought (1)World Models & Planning (1)

Frequent co-authors

Dong Li (2)Ting Xu (1)Xu He (1)Yupu Lu (1)

Papers (3)

Jun 1, 2026

Ting Xu +61w ago·also Stanford HAI, HKU

Unveiling the Entropy Dynamics of Chain-of-Thought Reasoning

Uncovering that CoT reasoning transitions from uncertainty to high reliability opens the door to more efficient inference strategies that can save computational resources without sacrificing accuracy.

Ting Xu, Xu He, Yupu Lu +4

Reasoning & Chain-of-Thought

May 26, 2026

Department of Foundation Model2w ago·also Tsinghua AI, TJU, Tongji

Ratio-Variance Regularized Policy Optimization

Ditch hard clipping: ratio-variance regularization offers a principled, "soft brake" approach to trust region policy optimization, unlocking substantial gains in sample efficiency and performance, especially for smaller LLMs.

Yu Luo, Yihan Hu, Lei Lv +4

Robotics & Embodied AI Training Efficiency & Optimization

Apr 2, 2026

Zihao Wu +9Apr 2, 2026

The Rank and Gradient Lost in Non-stationarity: Sample Weight Decay for Mitigating Plasticity Loss in Reinforcement Learning

Plasticity loss in RL isn't just about forgetting; it's about vanishing gradients, and a simple sample re-weighting can bring back the learning.

Zihao Wu, Zihao Wu, Hongyao Tang +7

Robotics & Embodied AI Training Efficiency & Optimization World Models & Planning

Search

Jianye Hao

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)