Sanjeda Akter

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Training Efficiency & Optimization (1)

Frequent co-authors

Ibne Farabi Shihab (1)

Papers (1)

Feb 12, 2026

Ibne Farabi Shihab +1Feb 12, 2026

Learning to Forget Attention: Memory Consolidation for Adaptive Compute Reduction

GPT-2 wastes 88% of its attention on predictable information, but this new method learns to forget, achieving a 37.8x compute reduction by dynamically consolidating episodic retrievals into parametric memory.

Ibne Farabi Shihab, Sanjeda Akter

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Sanjeda Akter

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)