Liyang Chen

Papers on Lattice

Total citations

Topics

h-index

Research focus

Speech & Audio (3)Computer Vision (2)Multimodal Models (2)Architecture Design (Transformers, SSMs, MoE) (1)Natural Language Processing (1)

Frequent co-authors

Shuhai Peng (1)Hui Lu (1)Jinjiang Liu (1)Guiping Zhong (1)

Papers (3)

Apr 21, 2026

Tsinghua AIApr 21, 2026·also CUHK

Towards Streaming Target Speaker Extraction via Chunk-wise Interleaved Splicing of Autoregressive Language Model

Autoregressive generative models, previously unsuitable for real-time target speaker extraction, can now achieve offline-level performance in streaming scenarios thanks to a novel chunk-wise splicing technique.

Shuhai Peng, Hui Lu, Jinjiang Liu +8

Architecture Design (Transformers, SSMs, MoE)Natural Language Processing Speech & Audio

Apr 15, 2026

Team Seedance +137Apr 15, 2026·also Arizona, ASU, BUPT, ByteDance +10

Seedance 2.0: Advancing Video Generation for World Complexity

Seedance 2.0 leapfrogs existing models by unifying multi-modal inputs (text, image, audio, video) into a single architecture for generating high-quality, longer-duration audio-video content.

Team Seedance, De Chen, Liyang Chen +135

Computer Vision Multimodal Models Speech & Audio

Feb 12, 2026

DreamID-Omni: Unified Framework for Controllable Human-Centric Audio-Video Generation

DreamID-Omni lets you precisely control multiple character identities and voice timbres in generated audio-video, even outperforming proprietary models.

Xu Guo, Fulong Ye, Qichao Sun +8

Computer Vision Multimodal Models Speech & Audio

Search

Liyang Chen

Research focus

Frequent co-authors

Papers (3)