Gabriele Oliaro

Research focus

Inference & Quantization (2)Code Generation & Program Synthesis (1)Eval Frameworks & Benchmarks (1)Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)

Frequent co-authors

Yichao Fu (1)May Jiang (1)Owen Lu (1)Junlin Wang (1)

Papers (2)

May 22, 2026

FastKernels: Benchmarking GPU Kernel Generation in Production

LLM-based GPU kernel generators ace synthetic benchmarks, but choke when faced with real-world production constraints, achieving at best 0.94x speedup.

Gabriele Oliaro, Yichao Fu, May Jiang +4

Code Generation & Program Synthesis Eval Frameworks & Benchmarks Inference & Quantization

Apr 14, 2026

Hongyi Jin +19Apr 14, 2026

Event Tensor: A Unified Abstraction for Compiling Dynamic Megakernel

Unlock 2x faster LLM serving and slash warmup times by fusing kernels that gracefully handle dynamic shapes and data dependencies.

Hongyi Jin, Bohan Hou, Guanjie Wang +17

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Search

Gabriele Oliaro

Research focus

Frequent co-authors

Papers (2)