Latticethe structure behind the noise

Papers Digest Topics Selected Labs Collections FAQ

Created by Flynn Lachendro

Papers Digest Topics Labs Saved

Search

Search papers, labs, and topics across Lattice.

Built by Flynn Lachendro·𝕏 / Twitter·RSS··FAQ·Glossary·Privacy

Tianrui Wang | Lattice

Tianrui Wang

Tianjin University

Papers on Lattice

4

Total citations

0

Topics

6

Publication activitypapers/week, last 8 weeks

Research focus

Speech & Audio (4)Multimodal Models (2)Natural Language Processing (2)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Ziyang Ma (2)Xie Chen (2)Xuanchen Li (1)Yuheng Lu (1)

Papers (4)

Jun 9, 2026

6d ago·also SJTU

Speech Meets ELF: Audio Conditional Continuous-Target Diffusion for Speech Recognition and Translation

Continuous-target modeling reveals a shared semantic mapping for ASR and S2TT, challenging conventional views on their error sources.

Xuanchen Li, Tianrui Wang, Yuheng Lu +11

Multimodal Models Natural Language Processing Speech & Audio

Jun 5, 2026

1w ago·also Fudan, Hunyuan Team, NTU, PKU +4

MMAE: A Massive Multitask Audio Editing Benchmark

Current audio editing models are failing spectacularly, with an Exact Match Rate below 5% in complex tasks, exposing a critical need for improvement.

Ziyang Ma, Ruiqi Yan, Ruiyang Xu +33

Eval Frameworks & Benchmarks Multimodal Models Speech & Audio

May 6, 2026

Yukun Chen +4May 6, 2026·also RUC, TJU

VocalParse: Towards Unified and Scalable Singing Voice Transcription with Large Audio Language Models

Unlock scalable, high-quality singing voice synthesis by directly generating structured musical scores from audio, outperforming existing systems on multiple datasets.

Yukun Chen, Tianrui Wang, Zhaoxi Mu +2

Architecture Design (Transformers, SSMs, MoE)Natural Language Processing Speech & Audio

Apr 14, 2026

Apr 14, 2026·also Fudan, Shanghai Innovation, SJTU, TJU

X-VC: Zero-shot Streaming Voice Conversion in Codec Space

Interactive voice conversion just got real: X-VC achieves state-of-the-art streaming WER and speaker similarity with significantly lower latency by operating directly in codec space.

Yuxiang Zhao, Yuxiang Zhao, Tianrui Wang +5

Inference & Quantization Speech & Audio

Architecture Design (Transformers, SSMs, MoE) (1)

Inference & Quantization (1)

Zikang Huang (1)

Chenghan Lin (1)

Chenrui Cui (1)