Junbo Niu

Papers on Lattice

Total citations

Topics

Research focus

Multimodal Models (2)Computer Vision (1)Eval Frameworks & Benchmarks (1)Reasoning & Chain-of-Thought (1)Speech & Audio (1)

Frequent co-authors

Xiang An (1)Yin Xie (1)Feilong Tang (1)Yunyao Yan (1)

Papers (2)

May 25, 2026

Xiang An +24May 25, 2026·also ERNIE Team, Monash, S-Lab, SenseTime +1

LLaVA-OneVision-2: Towards Next-Generation Perceptual Intelligence

LLaVA-OV-2's codec-stream tokenization lets it crush existing video-language models, especially in tasks requiring fine-grained temporal understanding of high-frequency motion.

Xiang An, Yin Xie, Feilong Tang +22

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

May 21, 2026

Tsinghua AIMay 21, 2026·also CAS, HKUST, Kuaishou, NJU +5

LatentOmni: Rethinking Omni-Modal Understanding via Unified Audio-Visual Latent Reasoning

Ditching text-based chain-of-thought unlocks better audio-visual reasoning by interleaving textual steps with a unified latent space that preserves dense sensory information.

Yifan Dai, Zhenhua Wu, Daili Hua +10

Multimodal Models Reasoning & Chain-of-Thought Speech & Audio

Search

Junbo Niu

Research focus

Frequent co-authors

Papers (2)