Shimin Li

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Speech & Audio (2)Multimodal Models (1)Natural Language Processing (1)

Frequent co-authors

Yaozhou Jiang (2)Chen Yang (1)Chufan Yu (1)Hanfu Chen (1)

Papers (2)

Jun 1, 2026

1w ago·also Tsinghua AI, Fudan, HFUT, Hunyuan Team +3

MOSS-Audio Technical Report

MOSS-Audio achieves state-of-the-art performance in audio understanding tasks by effectively integrating temporal cues and deep acoustic features, setting a new benchmark for audio-language models.

Chen Yang, Chufan Yu, Hanfu Chen +22

Multimodal Models Speech & Audio

Mar 30, 2026

Mar 30, 2026·also Shanghai Innovation

MOSS-VoiceGenerator: Create Realistic Voices with Natural Language Descriptions

Cinematic speech data unlocks more realistic and controllable voice generation from natural language descriptions.

Kexin Huang, Liwei Fan, Botian Jiang +9

Natural Language Processing Speech & Audio

Search

Shimin Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)