Hannes von Essen

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Natural Language Processing (1)

Frequent co-authors

Wilhelm Tranheden (1)Shahnawaz Ahmed (1)Devdatt Dubhashi (1)Jonna Matthiesen (1)

Papers (1)

Mar 15, 2026

Wilhelm Tranheden +42d ago

FlashHead: Efficient Drop-In Replacement for the Classification Head in Language Model Inference

Achieve up to 1.75x faster language model inference by swapping the standard classification head with FlashHead, a training-free retrieval-based alternative.

Wilhelm Tranheden, Shahnawaz Ahmed, Devdatt Dubhashi +2

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Natural Language Processing

Search

Hannes von Essen

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)