Latticethe structure behind the noise

Papers Digest Topics Selected Labs Collections FAQ

Created by Flynn Lachendro

Papers Digest Topics Labs Saved

Search

Search papers, labs, and topics across Lattice.

Built by Flynn Lachendro·𝕏 / Twitter·RSS··FAQ·Glossary·Privacy

Xiaogui Yang | Lattice

Xiaogui Yang

Papers on Lattice

3

Total citations

0

Topics

5

h-index

5

Research focus

Speech & Audio (3)Architecture Design (Transformers, SSMs, MoE) (2)Natural Language Processing (1)Open-Source Models & Weights (1)Multimodal Models (1)

Frequent co-authors

Zhaoye Fei (3)Yaozhou Jiang (2)Qinyuan Cheng (2)Xipeng Qiu (2)

Papers (3)

Mar 30, 2026

Mar 30, 2026·also Shanghai Innovation

MOSS-VoiceGenerator: Create Realistic Voices with Natural Language Descriptions

Cinematic speech data unlocks more realistic and controllable voice generation from natural language descriptions.

Kexin Huang, Liwei Fan, Botian Jiang +9

Natural Language Processing Speech & Audio

Mar 18, 2026

Mar 18, 2026·also Fudan

MOSS-TTS Technical Report

Achieve controllable and scalable speech generation with MOSS-TTS, enabling zero-shot voice cloning and long-form synthesis.

Yitian Gong, Y. Gong, Botian Jiang +28

Architecture Design (Transformers, SSMs, MoE)Open-Source Models & Weights Speech & Audio

Feb 11, 2026

Yitian Gong +11Feb 11, 2026

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

A purely Transformer-based audio tokenizer, pre-trained on 3M hours of data, leapfrogs existing codecs and even enables a fully autoregressive TTS model to outperform cascaded systems.

Yitian Gong, Y. Gong, Kuangwei Chen +9

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Speech & Audio

Yitian Gong (2)

Kuangwei Chen (2)

Mingshu Chen (2)