Cong Wan

Kairos achieves top-tier performance in Physical AI while ensuring efficient state management over extended time horizons, setting a new standard for operational world models.

Kairos Team, Fei Wang, Shan You +18

Robotics & Embodied AI World Models & Planning

May 25, 2026

May 25, 2026·also Tsinghua AI, Group

ProSR: Process-Shaped Spatial Reasoning for Reliable Chain-of-Thought in VLMs

VLMs often fail at spatial reasoning because they either ignore visual cues or exhibit unstable reasoning, but a novel process-shaping framework can fix this.

Jiangyang Li, Cong Wan, Changjie Wu +5

Computer Vision Multimodal Models Reasoning & Chain-of-Thought

Mar 16, 2026

Trajectory-Diversity-Driven Robust Vision-and-Language Navigation

RL agents can learn more robust vision-and-language navigation policies by exploring diverse trajectories and comparing their performance, even without expert demonstrations or value networks.

Jiangyang Li, Cong Wan, SongLin Dong +2

Computer Vision Multimodal Models Robotics & Embodied AI

Search

Cong Wan

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (5)