Dongfang Li

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Inference & Quantization (1)

Frequent co-authors

Luchang Li (1)Bozhao Gong (1)Yu Zhang (1)

Papers (1)

Mar 5, 2026

Luchang Li +31w ago

SLO-Aware Compute Resource Allocation for Prefill-Decode Disaggregated LLM Inference

Stop guessing at prefill/decode resource allocation: this method accurately predicts the optimal split for disaggregated LLM inference, balancing throughput and SLOs.

Luchang Li, Dongfang Li, Bozhao Gong +1

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Search

Dongfang Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)