Huanyu Qu

Guangdong Institute of Intelligence Science and Technology, University of Macau

Papers on Lattice

Total citations

Topics

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Training Efficiency & Optimization (1)

Frequent co-authors

Yi Huang (1)Songchen Ma (1)Mingkun Xu (1)

Papers (1)

May 21, 2026

May 21, 2026·also CUHK, GIST Guangdong, HKUST, UMacau

Meta-Soft: Leveraging Composable Meta-Tokens for Context-Preserving KV Cache Compression

LLMs can now compress their KV cache more effectively by dynamically synthesizing soft tokens tailored to the input, preserving crucial context that's otherwise lost with static methods.

Yi Huang, Songchen Ma, Huanyu Qu +1

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Huanyu Qu

Research focus

Frequent co-authors

Papers (1)