Nian Si

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Distributed Systems & Hardware (1)Inference & Quantization (1)

Frequent co-authors

Chengyi Nie (1)Zijie Zhou (1)

Papers (1)

May 6, 2026

Chengyi Nie +22w ago

A Queueing-Theoretic Framework for Stability Analysis of LLM Inference with KV Cache Memory Constraints

Forget heuristics: this queueing theory framework precisely predicts LLM inference stability under KV cache constraints, letting you right-size your GPU cluster.

Chengyi Nie, Nian Si, Zijie Zhou

Distributed Systems & Hardware Inference & Quantization

Search

Nian Si

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)