Latticethe structure behind the noise

Papers Digest Topics Selected Labs Collections FAQ

Created by Flynn Lachendro

Papers Digest Topics Labs Saved

Search

Search papers, labs, and topics across Lattice.

Built by Flynn Lachendro·𝕏 / Twitter·RSS··FAQ·Glossary·Privacy

Xuesong Yang | Lattice

Xuesong Yang

Papers on Lattice

3

Total citations

0

Topics

5

Publication activitypapers/week, last 8 weeks

Research focus

Speech & Audio (2)Architecture Design (Transformers, SSMs, MoE) (2)Computer Vision (1)Multimodal Models (1)

Frequent co-authors

Subhankar Ghosh (1)Jason Li (1)Paarth Neekhara (1)Shehzeen Hussain (1)

Papers (3)

Jun 16, 2026

NVIDIA3d ago

MagpieTTS-LF: Inference-Time Long-Form Speech Generation Without Training on Long-Form data

Long-form speech generation can now achieve remarkable coherence and naturalness without the need for extensive retraining on long-form datasets.

Subhankar Ghosh, Jason Li, Paarth Neekhara +4

Mar 13, 2026

Tsinghua AIMar 13, 2026·also Jilin

Cheers: Decoupling Patch Details from Semantic Representations Enables Unified Multimodal Comprehension and Generation

By decoupling patch details from semantics, Cheers achieves state-of-the-art multimodal performance at 20% of the training cost of comparable models.

Yichen Zhang, Danhong Peng, Da Peng +12

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Mar 3, 2026

Szu-Wei Fu +10Mar 3, 2026

Rethinking Training Targets, Architectures and Data Quality for Universal Speech Enhancement

Time-shifted anechoic speech beats early reflections as a training target for universal speech enhancement, leading to better perceptual quality and ASR performance.

Szu-Wei Fu, Rong Chao, Xuesong Yang +8

Architecture Design (Transformers, SSMs, MoE)Data Curation & Synthetic Data Speech & Audio

Data Curation & Synthetic Data (1)

Ryan Langman (1)

Yichen Zhang (1)

Danhong Peng (1)