Yao Shu

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

RLHF & Preference Learning (1)Training Efficiency & Optimization (1)Robotics & Embodied AI (1)World Models & Planning (1)

Frequent co-authors

Jian Mu (1)Tianyi Lin (1)Chengwei Qin (1)Zhongxiang Dai (1)

Papers (2)

May 29, 2026

Jian Mu +4May 29, 2026·also PolyU

DRIFT: Decoupled Rollouts and Importance-Weighted Fine-Tuning for Efficient Multi-Turn Optimization

Get RL-level multi-turn LLM performance with SFT-level efficiency by decoupling trajectory generation and optimization via importance weighting.

Jian Mu, Tianyi Lin, Chengwei Qin +2

RLHF & Preference Learning Training Efficiency & Optimization

Mar 9, 2026

Tsinghua AIMar 9, 2026·also M steps for a fair comparison., UChicago

Model-based Offline RL via Robust Value-Aware Model Learning with Implicitly Differentiable Adaptive Weighting

RAMBO's instability got you down? ROMI offers a robust, value-aware model learning approach with implicitly differentiable adaptive weighting that outperforms RAMBO and other SOTA methods in offline RL benchmarks.

Zhongjian Qiao, Jiafei Lyu, Boxiang Lyu +2

Robotics & Embodied AI World Models & Planning

Search

Yao Shu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)