Zhihang Tang

Zhejiang University 2 Qwen Team, Alibaba Group 3 Shanghai Jiao Tong University 4 Tsinghua University zuozhu.liu@zju.edu.cn

Tsinghua AI

Papers on Lattice

Total citations

Topics

Research focus

Computer Vision (2)Multimodal Models (2)Data Curation & Synthetic Data (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Zuozhu Liu (2)Songtao Jiang (1)Sibo Song (1)Chenyi Zhou (1)

Papers (2)

Mar 18, 2026

Tsinghua AIMar 18, 2026·also DAMO, SJTU

Learning Transferable Temporal Primitives for Video Reasoning via Synthetic Videos

Forget real-world video datasets: training VLMs on just 7.7K synthetic videos with temporal primitives beats 165K real-world examples, unlocking surprisingly effective transfer learning for video reasoning.

Songtao Jiang, Sibo Song, Chenyi Zhou +7

Computer Vision Data Curation & Synthetic Data Multimodal Models

Feb 25, 2026

Tsinghua AIFeb 25, 2026·also UBC, ZJU

UniVBench: Towards Unified Evaluation for Video Foundation Models

Current video benchmarks are too simple; UniVBench offers the first unified framework to measure the integrated capabilities of video foundation models using complex, multi-shot videos and a standardized evaluation system.

Jianhui Wei, Jianhui Wei, Xiaotian Zhang +7

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Search

Zhihang Tang

Research focus

Frequent co-authors

Papers (2)