Ali Hatamizadeh

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Inference & Quantization (2)Training Efficiency & Optimization (1)Tool Use & Agents (1)

Frequent co-authors

Jan Kautz (1)Aakshita Chandiramani (1)Aaron Blakeman (1)Abdullahi Olaoye (1)

Papers (2)

May 21, 2026

AI2May 21, 2026·also NVIDIA

Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention

Forget everything you thought you knew about linear attention: decoupling erase and write operations unlocks significantly better long-context retrieval.

Ali Hatamizadeh, Jan Kautz

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Apr 14, 2026

AI2Apr 14, 2026·also NVIDIA, BIT, NUDT, Waterloo

Nemotron 3 Super: Open, Efficient Mixture-of-Experts Hybrid Mamba-Transformer Model for Agentic Reasoning

Nemotron 3 Super proves you can achieve comparable accuracy to existing 120B models, but with significantly higher inference throughput, by combining Mamba, Attention, and Mixture-of-Experts.

Aakshita Chandiramani, Aaron Blakeman, Abdullahi Olaoye +452

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Tool Use & Agents

Search

Ali Hatamizadeh

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)