Jinghan Yao

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (2)Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Distributed Systems & Hardware (1)

Frequent co-authors

D. Panda (2)Sam Ad'e Jacobs (1)Walid Krichene (1)Masahiro Tanaka (1)

Papers (2)

Mar 31, 2026

Jinghan Yao +4Mar 31, 2026

MAC-Attention: a Match-Amend-Complete Scheme for Fast and Accurate Attention Computation

Achieve 14x attention speedups and 60% end-to-end latency reduction in long-context LLMs without sacrificing quality by reusing prior attention computations.

Jinghan Yao, Sam Ad'e Jacobs, Walid Krichene +2

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Jinghan Yao +4Mar 31, 2026

From Skew to Symmetry: Node-Interconnect Multi-Path Balancing with Execution-time Planning for Modern GPU Clusters

Skewed communication patterns are leaving massive GPU cluster bandwidth on the table, but NIMBLE unlocks up to 5.2x higher throughput by dynamically balancing traffic at runtime.

Jinghan Yao, Kaushik Kandadi, B. Ramesh +2

Distributed Systems & Hardware Training Efficiency & Optimization World Models & Planning

Search

Jinghan Yao

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)