Shengbo Eben Li

Tsinghua University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

World Models & Planning (3)Robotics & Embodied AI (3)Training Efficiency & Optimization (2)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Yinuo Wang (2)Keru Wang (1)Yixin Deng (1)Yao Lyu (1)

Papers (5)

Jul 20, 2026

University College Dublin6d ago·also Tsinghua AI

Distributional Soft Bellman Operator under the Cramér Geometry

The Cramér-geometric Bellman operator reveals a unique fixed point that could transform how we approach evaluation errors in distributional reinforcement learning.

Keru Wang, Yixin Deng, Yao Lyu +2

World Models & Planning

Jun 18, 2026

Jun 18, 2026·also NVIDIA, Tsinghua AI, HKU, Huawei +4

World Engine: Towards the Era of Post-Training for Autonomous Driving

Post-training on synthesized safety-critical scenarios can dramatically enhance the reliability of autonomous driving systems, reducing failures in rare but critical events.

Tianyu Li, Li Chen, Caojun Wang +12

Robotics & Embodied AI World Models & Planning

Mar 3, 2026

Tsinghua AIMar 3, 2026·also Didi Voyager Labs, NJU

Real-Time Generative Policy via Langevin-Guided Flow Matching for Autonomous Driving

Achieve real-time autonomous driving policy generation with a new flow-matching RL algorithm that slashes inference latency without sacrificing performance.

Tianze Zhu, Yinuo Wang, Wenjun Zou +5

Robotics & Embodied AI Training Efficiency & Optimization World Models & Planning

Mar 2, 2026

Mar 2, 2026·also Tsinghua AI, HKU, Li Auto, Waymo

DriveCombo: Benchmarking Compositional Traffic Rule Reasoning in Autonomous Driving

MLLMs that ace simple traffic rules still struggle when multiple rules interact, especially when they conflict, revealing a critical gap in their ability to handle real-world driving complexity.

Enhui Ma, Jiahuan Zhang, Guantian Zheng +7

Eval Frameworks & Benchmarks Multimodal Models Robotics & Embodied AI

Feb 17, 2026

Tsinghua AIFeb 17, 2026·also Didi Voyager Labs

STAPO: Stabilizing Reinforcement Learning for LLMs by Silencing Rare Spurious Tokens

A mere 0.01% of tokens can destabilize LLM reinforcement learning, but masking their gradient updates unlocks significant performance gains.

Guojian Zhan, Zhilong Zheng, Yinuo Wang +4

Reasoning & Chain-of-Thought RLHF & Preference Learning Training Efficiency & Optimization

Search

Shengbo Eben Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (5)