Naoki Matsuda

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Distributed Systems & Hardware (1)Inference & Quantization (1)

Frequent co-authors

Hiroki Matsutani (1)Hiroki Matsutani (1)Naoki Matsuda (1)Nao Sugiura (1)

Papers (1)

Feb 26, 2026

Hiroki Matsutani +52w ago

Accelerating Local LLMs on Resource-Constrained Edge Devices via Distributed Prompt Caching

Edge devices can achieve a 93% reduction in time-to-first-token for local LLM inference by cooperatively caching and sharing intermediate processing states.

Hiroki Matsutani, Hiroki Matsutani, Naoki Matsuda +3

Distributed Systems & Hardware Inference & Quantization

Search

Naoki Matsuda

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)