Yong Jae Lee

Papers on Lattice

Total citations

Topics

h-index

Research focus

Eval Frameworks & Benchmarks (1)Multimodal Models (1)Speech & Audio (1)

Frequent co-authors

Nguyen Le Minh (1)Zhuoran Yu (1)Samuel Low Yu Hang (1)Subin An (1)

Papers (1)

Dec 1, 2025

Nguyen Le Minh +10Dec 1, 2025

See, Hear, and Understand: Benchmarking Audiovisual Human Speech Understanding in Multimodal Large Language Models

Current MLLMs struggle to connect who is speaking with what they are saying in videos, highlighting a critical gap in fine-grained audiovisual reasoning that AV-SpeakerBench now exposes.

Nguyen Le Minh, Zhuoran Yu, Samuel Low Yu Hang +8

Eval Frameworks & Benchmarks Multimodal Models Speech & Audio

Search

Yong Jae Lee

Research focus

Frequent co-authors

Papers (1)