Hanqi Lyu

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Inference & Quantization (1)

Frequent co-authors

Alish Kanani (1)Sangwan Lee (1)Sang-Won Lee (1)Jiahao Lin (1)

Papers (1)

Mar 16, 2026

DUET: Disaggregated Hybrid Mamba-Transformer LLMs with Prefill and Decode-Specific Packages

Hybrid Mamba-Transformer models can get 4x faster time to first token and 1.4x higher throughput by disaggregating prefill and decode phases onto specialized accelerator packages.

Alish Kanani, Sangwan Lee, Sang-Won Lee +5

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Search

Hanqi Lyu

Research focus

Frequent co-authors

Papers (1)