C. Santoni

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Open-Source Models & Weights (1)

Frequent co-authors

Cosmo Santoni (1)

Papers (1)

Mar 10, 2026

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Mamba-2's efficiency doesn't require custom CUDA kernels: XLA's compiler optimizations are enough to unlock near-optimal performance across diverse hardware.

C. Santoni, Cosmo Santoni

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Open-Source Models & Weights

Search

C. Santoni

Research focus

Frequent co-authors

Papers (1)