Longteng Guo

Chinese Academy of Sciences

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (5)Robotics & Embodied AI (3)Reasoning & Chain-of-Thought (2)World Models & Planning (2)

Frequent co-authors

Yanghong Mei (3)Zijia Zhao (2)Jie Jiang (2)Ming-Ming Yu (2)

Papers (6)

Jul 6, 2026

1w ago·also OPPO

TimeThink: Reasoning with Time for Video LLMs

TimeThink revolutionizes video reasoning by enabling models to pinpoint relevant temporal evidence with unprecedented accuracy, outperforming existing approaches.

Handong Li, Longteng Guo, Zikang Liu +8

Multimodal Models Reasoning & Chain-of-Thought RLHF & Preference Learning

Jun 23, 2026

Yanghong Mei +42w ago·also CAS

NavWM: A Unified Navigation World Model for Foresight-Driven Planning

NavWM redefines navigation by combining perception, generation, and control into a single framework, leading to unprecedented improvements in planning and foresight.

Yanghong Mei, Longteng Guo, Ming-Ming Yu +2

Multimodal Models World Models & Planning

Ming-Ming Yu +62w ago·also CAS

SurveilNav: Collaborative Object Goal Navigation with Robot and Surveillance System

SurveilNav achieves state-of-the-art navigation success rates by seamlessly integrating robot perception with multi-view surveillance, transforming how robots can navigate complex environments.

Ming-Ming Yu, Qunbo Wang, Rongtao Xu +4

Computer Vision Robotics & Embodied AI

Jun 9, 2026

VeriSpace: Spatially Grounded Action Verification for Vision-Language-Action Models

Action verification can now be reliably performed in VLA models, reducing the risk of grasp failures and task errors in real-world robotic applications.

Guiyu Zhao, Longteng Guo, Junyou Zhu +4

Multimodal Models Robotics & Embodied AI

Jun 4, 2026

Jun 4, 2026·also CAS, CUHK, Zhongguancun Academy

LongSpace: Exploring Long-Horizon Spatial Memory from Perception to Recall in Video

LongSpace reveals that integrating explicit spatial memory into MLLMs can dramatically enhance their performance on long-horizon tasks, a critical advancement for applications in autonomous navigation.

Shiqiang Lang, Haoyang He, Yuanteng Chen +4

Multimodal Models Robotics & Embodied AI World Models & Planning

Apr 28, 2026

EverMind AI Inc.Apr 28, 2026·also CAS

M$^3$-VQA: A Benchmark for Multimodal, Multi-Entity, Multi-Hop Visual Question Answering

Today's best multimodal LLMs still struggle to grasp fine-grained details and reason across multiple entities in images, even with access to external knowledge.

Jiatong Ma, Longteng Guo, Yuchen Liu +3

Eval Frameworks & Benchmarks Multimodal Models Reasoning & Chain-of-Thought

Search

Longteng Guo

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (6)