Mengyue Wu

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Speech & Audio (2)Natural Language Processing (1)

Frequent co-authors

Zihao Zheng (1)Wen Wu (1)Chao Zhang (1)Xuenan Xu (1)

Papers (2)

Mar 17, 2026

CAST-TTS: A Simple Cross-Attention Framework for Unified Timbre Control in TTS

Ditch the separate models: CAST-TTS uses a single cross-attention mechanism to control TTS timbre from both speech and text, rivaling specialized models in quality.

Zihao Zheng, Wen Wu, Chao Zhang +2

Architecture Design (Transformers, SSMs, MoE)Natural Language Processing Speech & Audio

Feb 26, 2026

Feb 26, 2026·also Tencent AI

SemanticVocoder: Bridging Audio Generation and Audio Understanding via Semantic Latents

Ditching VAE acoustic latents for semantic latents unlocks more semantically meaningful audio generation, outperforming traditional methods on AudioCaps.

Zeyu Xie, Chenxing Li, Qiaoqiao Jin +5

Architecture Design (Transformers, SSMs, MoE)Speech & Audio

Search

Mengyue Wu

Research focus

Frequent co-authors

Papers (2)