Hexin Liu

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Speech & Audio (2)Eval Frameworks & Benchmarks (1)Natural Language Processing (1)Multimodal Models (1)

Frequent co-authors

Haoyang Zhang (2)Xiangyue Zhang (1)Xiangyu Zhang (1)Haoyang Zhang (1)

Papers (2)

May 28, 2026

3w ago·also StepFun

The WER Trap: Shattering the Illusion of Unified Tokens in Speech Language Models

Low Word Error Rate can be a mirage: compressing speech to "pure" semantic tokens, even with near-perfect WER, produces unintelligible speech when used for generation.

Xiangyue Zhang, Xiangyu Zhang, Haoyang Zhang +11

Eval Frameworks & Benchmarks Natural Language Processing Speech & Audio

Apr 28, 2026

Yuxin Zhang +21Apr 28, 2026·also NTU

Step-Audio-R1.5 Technical Report

RLVR, the dominant training paradigm for audio language models, may be turning them into unfeeling "answering machines" that excel on benchmarks but fail the vibe check.

Yuxin Zhang, Xiangyu Tony Zhang, Xiangyu Zhang +19

Multimodal Models Reasoning & Chain-of-Thought RLHF & Preference Learning+1

Search

Hexin Liu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)