Ma Zirui

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Inference & Quantization (1)

Frequent co-authors

Zhihua Fan (1)Wenxing Li (1)Wenxin Li (1)Haibin Wu (1)

Papers (1)

Apr 28, 2026

Ma Zirui +73w ago

AHASD: Asynchronous Heterogeneous Architecture for LLM Adaptive Drafting Speculative Decoding on Mobile Devices

Mobile LLM inference just got a whole lot faster: AHASD achieves up to 4.2x throughput and 5.6x energy efficiency gains by intelligently decoupling and managing drafting and verification tasks on a PIM-NPU architecture.

Ma Zirui, Zhihua Fan, Wenxing Li +5

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Search

Ma Zirui

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)