Dingyan Zhang

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Inference & Quantization (1)

Frequent co-authors

Jinbo Han (1)Kaixi Zhang (1)Xingda Wei (1)Rong Chen (1)

Papers (1)

Mar 16, 2026

DAMO1d ago·also SJTU

LMetric: Simple is Better - Multiplication May Be All You Need for LLM Request Scheduling

Forget complex scheduling algorithms: multiplying KV-cache availability with load balance is surprisingly effective for LLM request routing, slashing time-to-first-token by up to 92%.

Dingyan Zhang, Jinbo Han, Kaixi Zhang +2

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Search

Dingyan Zhang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)