Umit Ogras

University of Wisconsin-Madison

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Distributed Systems & Hardware (2)Training Efficiency & Optimization (1)Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)

Frequent co-authors

Zhengxiong Li (1)Tsung-Wei Huang (1)Miao Sun (1)Alish Kanani (1)

Papers (2)

Jun 3, 2026

1w ago

SET: Stream-Event-Triggered Scheduling for Efficient CUDA Graph Pipelines

Achieving up to 1.44X speedup in GPU performance by radically rethinking task scheduling and resource utilization in CUDA pipelines.

Zhengxiong Li, Tsung-Wei Huang, Umit Ogras

Distributed Systems & Hardware Training Efficiency & Optimization

Mar 16, 2026

LEXI: Lossless Exponent Coding for Efficient Inter-Chiplet Communication in Hybrid LLMs

LLMs can run up to 35% faster on chiplet architectures thanks to a new lossless exponent compression technique that slashes inter-chiplet communication overhead.

Miao Sun, Alish Kanani, Kaushik Shroff +2

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Search

Umit Ogras

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)