Rome Thorstenson

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Distributed Systems & Hardware (1)Inference & Quantization (1)

Frequent co-authors

Alessio Ricci Toniolo (1)Abinaya Dinesh (1)

Papers (1)

Feb 12, 2026

Alessio Ricci Toniolo +2Feb 12, 2026

GORGO: Maximizing KV-Cache Reuse While Minimizing Network Latency in Cross-Region LLM Load Balancing

Forget naive load balancing: GORGO slashes LLM inference latency by 2.5x with a centralized, network-aware proxy that intelligently routes requests across regions.

Alessio Ricci Toniolo, Abinaya Dinesh, Rome Thorstenson

Distributed Systems & Hardware Inference & Quantization

Search

Rome Thorstenson

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)