Y. Gong

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Speech & Audio (2)Open-Source Models & Weights (1)Multimodal Models (1)

Frequent co-authors

Yitian Gong (2)Kuangwei Chen (2)Mingshu Chen (2)Ruixiao Li (2)

Papers (2)

Mar 18, 2026

Mar 18, 2026·also Fudan

MOSS-TTS Technical Report

Achieve controllable and scalable speech generation with MOSS-TTS, enabling zero-shot voice cloning and long-form synthesis.

Yitian Gong, Y. Gong, Botian Jiang +28

Architecture Design (Transformers, SSMs, MoE)Open-Source Models & Weights Speech & Audio

Feb 11, 2026

Yitian Gong +11Feb 11, 2026

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

A purely Transformer-based audio tokenizer, pre-trained on 3M hours of data, leapfrogs existing codecs and even enables a fully autoregressive TTS model to outperform cascaded systems.

Yitian Gong, Y. Gong, Kuangwei Chen +9

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Speech & Audio

Search

Y. Gong

Research focus

Frequent co-authors

Papers (2)