Ziwei Liu

Papers on Lattice

Total citations

Topics

h-index

Research focus

Computer Vision (3)Eval Frameworks & Benchmarks (2)Multimodal Models (2)Tool Use & Agents (2)Robotics & Embodied AI (2)

Frequent co-authors

Yuhao Dong (3)Ziwei Liu (2)Haozhe Xie (2)Haozhe Xie (2)

Papers (5)

Apr 6, 2026

Chaoyou Fu +22Apr 6, 2026

Video-MME-v2: Towards the Next Stage in Benchmarks for Comprehensive Video Understanding

Leaderboard-topping video models are still surprisingly brittle, failing on basic video reasoning tasks unless given the right textual cues.

Chaoyou Fu, Hao Yuan, Haozhi Yuan +20

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Xi’an Jiao Tong UniversityApr 6, 2026·also NTU, S-Lab

FileGram: Grounding Agent Personalization in File-System Behavioral Traces

Forget dialogue summaries – FileGram builds user profiles directly from atomic file-system actions, unlocking a richer, more privacy-preserving approach to agent personalization.

Shuai Liu, Shuai Liu, Shulin Tian +13

Data Curation & Synthetic Data Tool Use & Agents

Mar 19, 2026

Chenyang Gu +7Mar 19, 2026·also SenseTime

Bridging Semantic and Kinematic Conditions with Diffusion-based Discrete Motion Tokenizer

Achieve 9x lower trajectory error and 3x better FID in motion generation by using a diffusion-based discrete motion tokenizer that elegantly handles both semantic and kinematic constraints.

Chenyang Gu, Chenyang Gu, Mingyuan Zhang +5

Computer Vision Robotics & Embodied AI World Models & Planning

Haitian Li +9Mar 19, 2026

MonoArt: Progressive Structural Reasoning for Monocular Articulated 3D Reconstruction

Unlock real-time 3D understanding: MonoArt achieves state-of-the-art monocular articulated object reconstruction without relying on multi-view data or external motion templates.

Haitian Li, Haozhe Xie, Haozhe Xie +7

Computer Vision Reasoning & Chain-of-Thought Robotics & Embodied AI

Mar 16, 2026

Xuanyu Zhu +12Mar 16, 2026

VTC-Bench: Evaluating Agentic Multimodal Models via Compositional Visual Tool Chaining

Today's best multimodal models can only solve half of compositional visual tool-use tasks, revealing a critical gap in their ability to plan and execute complex, multi-step visual reasoning.

Xuanyu Zhu, Yuhao Dong, Rundong Wang +10

Eval Frameworks & Benchmarks Multimodal Models Tool Use & Agents

Search

Ziwei Liu

Research focus

Frequent co-authors

Papers (5)