Luca Benini

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Distributed Systems & Hardware (2)Inference & Quantization (2)

Frequent co-authors

Chi Zhang (1)Luca Colagrande (1)Renzo Andri (1)Marco Bertuletti (1)

Papers (2)

Apr 2, 2026

Chi Zhang +33w ago

FlatAttention: Dataflow and Fabric Collectives Co-Optimization for Large Attention-Based Model Inference on Tile-Based Accelerators

Tile-based accelerators can now achieve near-peak utilization for attention layers thanks to FlatAttention, which slashes HBM traffic and outperforms even optimized GPU implementations.

Chi Zhang, Luca Colagrande, Renzo Andri +1

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Marco Bertuletti +103w ago

TensorPool: A 3D-Stacked 8.4TFLOPS/4.3W Many-Core Domain-Specific Processor for AI-Native Radio Access Networks

Domain-specific hardware can deliver massive efficiency gains (9.1x GOPS/W/mm²) for AI-accelerated 6G radio access networks.

Marco Bertuletti, Marco Bertuletti, Yichao Zhang +8