Zhi-Xin Yang

Papers on Lattice

Total citations

Topics

h-index

Research focus

Multimodal Models (3)Robotics & Embodied AI (3)Computer Vision (2)World Models & Planning (1)

Frequent co-authors

Hanbing Li (2)Lin Zhao (2)Shaoqing Xu (2)Fang Li (2)

Papers (3)

Apr 30, 2026

Pengna Li +8Apr 30, 2026

SpaAct: Spatially-Activated Transition Learning with Curriculum Adaptation for Vision-Language Navigation

Teaching VLMs to "look back" and "look ahead" with lightweight spatial reasoning tasks unlocks surprisingly strong navigation performance.

Pengna Li, Kangyi Wu, Shaoqing Xu +6

Computer Vision Multimodal Models Robotics & Embodied AI

Apr 19, 2026

Apr 19, 2026·also BIT, UMacau, Xiaomi EV

Think before Go: Hierarchical Reasoning for Image-goal Navigation

Image-goal navigation gets a boost from hierarchical reasoning, using vision-language models for high-level planning and online RL for low-level execution, significantly reducing wandering and improving success in complex environments.

Shaoqing Xu, Fang Li, Lin Zhao +2

Computer Vision Multimodal Models Robotics & Embodied AI

Apr 1, 2026

Sicheng Zuo +8Apr 1, 2026·also Xiaomi EV

DVGT-2: Vision-Geometry-Action Model for Autonomous Driving at Scale

Ditch language descriptions: this new driving model leverages dense 3D geometry for superior autonomous driving performance and cross-camera generalization.

Sicheng Zuo, Zixun Xie, Wenzhao Zheng +6

Multimodal Models Robotics & Embodied AI World Models & Planning

Search

Zhi-Xin Yang

Research focus

Frequent co-authors

Papers (3)