Yue Ding

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (2)Speech & Audio (2)Eval Frameworks & Benchmarks (1)Reasoning & Chain-of-Thought (1)

Frequent co-authors

Yang Shi (2)Bozhou Li (2)Bohan Zeng (2)Yuanxing Zhang (2)

Papers (2)

May 25, 2026

6d ago·also Tsinghua AI, AI Lab, github.com, HKUST +4

LongAV-Compass: Towards Unified Evaluation of Minute-Scale Audio-Visual Generation Across T2AV, I2AV, and V2AV

Current audio-visual generation models struggle to maintain coherence and alignment when scaling to minute-long content, a problem exposed by the new LongAV-Compass benchmark.

Tengfei Liu, Yang Shi, Xuanyu Zhu +17

Eval Frameworks & Benchmarks Multimodal Models Speech & Audio

May 21, 2026

1w ago·also Tsinghua AI, CAS, HKUST, Kuaishou +3

LatentOmni: Rethinking Omni-Modal Understanding via Unified Audio-Visual Latent Reasoning

Ditching text-based chain-of-thought unlocks better audio-visual reasoning by interleaving textual steps with a unified latent space that preserves dense sensory information.

Yifan Dai, Zhenhua Wu, Bohan Zeng +18

Multimodal Models Reasoning & Chain-of-Thought Speech & Audio

Search

Yue Ding

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)