Renzo Andri

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Inference & Quantization (1)

Frequent co-authors

Chi Zhang (1)Luca Colagrande (1)Luca Benini (1)

Papers (1)

Apr 2, 2026

Chi Zhang +33w ago

FlatAttention: Dataflow and Fabric Collectives Co-Optimization for Large Attention-Based Model Inference on Tile-Based Accelerators

Tile-based accelerators can now achieve near-peak utilization for attention layers thanks to FlatAttention, which slashes HBM traffic and outperforms even optimized GPU implementations.

Chi Zhang, Luca Colagrande, Renzo Andri +1

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Search

Renzo Andri

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)