Zhen-Hua Ling

University of Science and Technology of China

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Speech & Audio (5)Inference & Quantization (2)Eval Frameworks & Benchmarks (1)Data Curation & Synthetic Data (1)

Frequent co-authors

Yang Ai (4)Xiao-Hang Jiang (3)Rui-Chen Zheng (2)Ji Wu (2)

Papers (5)

Jun 4, 2026

1w ago·also Tsinghua AI, iFlytek

An Ultra-Low-Bitrate Neural Speech Codec with Plain-to-Pseudo Synergistic Vector Quantization

Achieving high-quality speech reconstruction at just 0.5 kbps could revolutionize low-bandwidth communication systems.

Xiao-Hang Jiang, Yang Ai, Fei Liu +4

Inference & Quantization Speech & Audio

1w ago·also Tsinghua AI

VoCodec: A Low-bitrate Streamable Neural Speech Codec with Voicing-driven Quantization

VoCodec achieves a remarkable 27% bitrate reduction while enhancing speech quality by intelligently allocating resources based on voicing characteristics.

Xiao-Hang Jiang, Yang Ai, Rui-Chen Zheng +3

Inference & Quantization Speech & Audio

1w ago·also iFlytek

Beyond WER: A Paired Acoustic Stress Test for Ambient Clinical Scribes

Minor acoustic noise can nearly double the rate of unsafe outputs in clinical documentation, despite only a slight increase in Word Error Rate.

Xiao-Hang Jiang, Han-Jie Guo, Ying-Si Liang +4

Eval Frameworks & Benchmarks Speech & Audio

1w ago·also DISCOVER Robotics † Advising, Edinburgh

CoSTA: Cognitive-State-Conditioned TTS Data Augmentation Using ASR Transcripts for Alzheimer's Disease Detection

ASR-driven data augmentation boosts Alzheimer's detection accuracy by over 4%, showcasing the potential of synthetic speech in clinical diagnostics.

Yin-Long Liu, Yuanchao Li, Yiming Wang +8

Data Curation & Synthetic Data Speech & Audio

Jun 1, 2026

DAMO2w ago·also USTC

UniVocal: Unified Speech-Singing Code-Switching Synthesis

Seamless transitions between speech and singing modes are now driven purely by text context, achieving state-of-the-art results in code-switching synthesis.

Yufei Shi, Qian Chen, Zhen-Hua Ling +1

Multimodal Models Speech & Audio

Search

Zhen-Hua Ling

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (5)