David H. Yang

Rensselaer Polytechnic Institute

Papers on Lattice

Total citations

Topics

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Reasoning & Chain-of-Thought (1)

Frequent co-authors

Yuxuan Zhu (1)Mohammad Mohammadi Amiri (1)Keerthiram Murugesan (1)Subhajit Chaudhury (1)

Papers (1)

Apr 13, 2026

Apr 13, 2026·also IBM Research

ZoomR: Memory Efficient Reasoning through Multi-Granularity Key Value Retrieval

LLMs can slash memory use by 4x during reasoning without sacrificing accuracy, simply by "zooming in" on relevant cached information instead of attending to everything.

David H. Yang, Yuxuan Zhu, Mohammad Mohammadi Amiri +2

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Reasoning & Chain-of-Thought

Search

David H. Yang

Research focus

Frequent co-authors

Papers (1)