Xiaoxiao Miao

The optimal spectrogram configuration for audio and speech analysis hinges on a nuanced interplay between front-end feature representation and back-end classifier architecture, varying significantly across tasks.

Ian McLoughlin, L. Pham, Yan Song +8

Computer Vision Speech & Audio

Mar 9, 2026

Tsinghua AIMar 9, 2026·also Duke

Language-Invariant Multilingual Speaker Verification for the TidyVoice 2026 Challenge

Adversarial training and synthetic data can significantly boost multilingual speaker verification performance, even with limited training data.

Ze Li, Xiaoxiao Miao, Juan Liu +1

Natural Language Processing Speech & Audio

Mar 5, 2026

Training Dynamics-Aware Multi-Factor Curriculum Learning for Target Speaker Extraction

Forget hand-crafted curricula: TSE-Datamap leverages training dynamics to automatically surface optimal learning schedules for target speaker extraction.

Xuechen Liu, Xiaoxiao Miao, Junichi Yamagishi

Data Curation & Synthetic Data Speech & Audio Training Efficiency & Optimization

Search

Xiaoxiao Miao

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (4)