Mingtao Hu

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)

Frequent co-authors

Jiahuan Yu (1)Zichao Lin (1)Minjia Zhang (1)

Papers (1)

Jan 28, 2026

Jan 28, 2026·also Regensburg

SuperInfer: SLO-Aware Rotary Scheduling and Memory Management for LLM Inference on Superchips

SuperInfer unlocks the potential of superchips for LLM serving by proactively rotating requests to meet stringent latency SLOs, achieving up to 74.7% improvement in Time-To-First-Token attainment.

Jiahuan Yu, Mingtao Hu, Zichao Lin +1

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization

Search

Mingtao Hu

Research focus

Frequent co-authors

Papers (1)