Masahiro Tanaka

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Training Efficiency & Optimization (2)Distributed Systems & Hardware (1)Inference & Quantization (1)

Frequent co-authors

Ahan Gupta (1)Zhihao Wang (1)Neel Dani (1)Olatunji Ruwase (1)

Papers (2)

Apr 29, 2026

Ahan Gupta +52d ago

AutoSP: Unlocking Long-Context LLM Training Via Compiler-Based Sequence Parallelism

Training LLMs on ultra-long contexts just got a whole lot easier: AutoSP automates sequence parallelism and activation checkpointing, boosting context length by up to 2.7x with negligible throughput cost.

Ahan Gupta, Zhihao Wang, Neel Dani +3

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

Mar 31, 2026

Jinghan Yao +4Mar 31, 2026

MAC-Attention: a Match-Amend-Complete Scheme for Fast and Accurate Attention Computation

Achieve 14x attention speedups and 60% end-to-end latency reduction in long-context LLMs without sacrificing quality by reusing prior attention computations.

Jinghan Yao, Sam Ad'e Jacobs, Walid Krichene +2

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Masahiro Tanaka

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)