Yuxin Li

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Speech & Audio (2)Eval Frameworks & Benchmarks (1)Natural Language Processing (1)Architecture Design (Transformers, SSMs, MoE) (1)

Frequent co-authors

Xiangyu Zhang (2)Haoyang Zhang (2)Xiangyue Zhang (1)Haoyang Zhang (1)

Papers (2)

May 28, 2026

3d ago

The WER Trap: Shattering the Illusion of Unified Tokens in Speech Language Models

Low Word Error Rate can be a mirage: compressing speech to "pure" semantic tokens, even with near-perfect WER, produces unintelligible speech when used for generation.

Xiangyue Zhang, Xiangyu Zhang, Yuxin Li +12

Eval Frameworks & Benchmarks Natural Language Processing Speech & Audio

May 22, 2026

Open-Sora Plan Team1w ago·also Annenberg School of Communication and Journalism, Department of Foundation Model, Group, PKU +5

StepAudio 2.5 Technical Report

Forget specialized architectures: StepAudio 2.5 proves a single audio-language foundation, shaped by RLHF, can dominate ASR, TTS, and real-time dialogue simultaneously.

Bin Lin, Bo Zhao, Boyong Wu +96

Architecture Design (Transformers, SSMs, MoE)Open-Source Models & Weights Speech & Audio

Search

Yuxin Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)