Björn W. Schuller

Papers on Lattice

Total citations

Topics

h-index

Research focus

Computer Vision (1)Multimodal Models (1)Speech & Audio (1)

Frequent co-authors

Jiadong Wang (1)Jiadong Wang (1)Ke Zhang (1)Xinyuan Qian (1)

Papers (1)

Mar 2, 2026

Mar 2, 2026·also Center for Machine Learning, CUHK, Imperial, Shenzhen Loop Area Institute +1

CueNet: Robust Audio-Visual Speaker Extraction through Cross-Modal Cue Mining and Interaction

CueNet achieves robust audio-visual speaker extraction under visual degradation by cleverly disentangling and integrating speaker information, acoustic synchronisation, and semantic synchronisation cues, without needing training on degraded visual data.

Jiadong Wang, Jiadong Wang, Ke Zhang +6

Computer Vision Multimodal Models Speech & Audio

Search

Björn W. Schuller

Research focus

Frequent co-authors

Papers (1)