Lattice AI Research

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Natural Language Processing (2)Training Efficiency & Optimization (1)Inference & Quantization (1)

Frequent co-authors

Anirudh Kanchi (1)Garv Shah (1)Prakhar Gupta (1)Kushal Patel (1)

Papers (2)

Apr 6, 2026

Satyam Goyal +33w ago

Improving Sparse Memory Finetuning

Forget catastrophic forgetting: sparse memory finetuning, enhanced with a KL-divergence-based update rule, lets LLMs learn continuously without trashing old knowledge.

Satyam Goyal, Anirudh Kanchi, Garv Shah +1

Architecture Design (Transformers, SSMs, MoE)Natural Language Processing Training Efficiency & Optimization

Satyam Goyal +33w ago·also UMich

DualDiffusion: A Speculative Decoding Strategy for Masked Diffusion Models

Masked diffusion models can finally achieve faster inference without sacrificing generation quality, thanks to a clever speculative decoding scheme.

Satyam Goyal, Kushal Patel, Tanush Mittal +1

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Natural Language Processing

Search

Satyam Goyal

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)