Taimur Khan

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Training Efficiency & Optimization (1)

Papers (1)

Mar 2, 2026

Taimur Khan2w ago

TiledAttention: a CUDA Tile SDPA Kernel for PyTorch

Ditch the CUDA boilerplate: TiledAttention lets you rapidly prototype and tweak custom attention kernels directly from Python, unlocking faster iteration on novel SDPA architectures.

Taimur Khan

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

Search

Taimur Khan

Publication activitypapers/week, last 8 weeks

Research focus

Papers (1)