Xuyang Liu

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (2)Architecture Design (Transformers, SSMs, MoE) (1)Speech & Audio (1)Multimodal Models (1)

Frequent co-authors

Yuxuan Wang (1)Peize He (1)Peize He (1)Xiyan Gui (1)

Papers (2)

Apr 8, 2026

3w ago·also HKUST, SJTU, Xidian

AudioKV: KV Cache Eviction in Efficient Large Audio Language Models

Audio-specific KV cache eviction lets you compress LALMs by 40% with almost no accuracy loss, while generic methods fall apart.

Yuxuan Wang, Peize He, Peize He +7

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Speech & Audio

Mar 16, 2026

Mar 16, 2026·also SJTU

Flash-Unified: A Training-Free and Task-Aware Acceleration Framework for Native Unified Models

Unified multimodal models secretly contain separate inference pathways for generation and understanding, and FlashU unlocks this hidden potential for 2x speedup without retraining.

Junlong Ke, Yantai Yang, Xuyang Liu +3

Inference & Quantization Multimodal Models Training Efficiency & Optimization

Search

Xuyang Liu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)