Timon Klein

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Training Efficiency & Optimization (1)

Frequent co-authors

Jonas Kusch (1)Sebastian Sager (1)Stefan Schnake (1)Steffen Schotthöfer (1)

Papers (1)

Mar 31, 2026

Timon Klein +41d ago

Tucker Attention: A generalization of approximate attention mechanisms

Tucker Attention squeezes an order of magnitude more parameter efficiency out of attention layers, while unifying and simplifying Group Query Attention, Multi-Head Latent Attention, and standard Multi-Head Attention.

Timon Klein, Jonas Kusch, Sebastian Sager +2

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Timon Klein

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)