Zoe Wanying He

Shanghai Jiao Tong University, University of California

Papers on Lattice

Total citations

Topics

Research focus

Inference & Quantization (1)Scaling Laws & Emergent Abilities (1)

Frequent co-authors

Yujie Chen (1)Tailai Chen (1)Yifeng Gao (1)Yijue Xu (1)

Papers (1)

Apr 20, 2026

Apr 20, 2026·also CMU ML, SJTU, University of California, UT Austin

Stability Implies Redundancy: Delta Attention Selective Halting for Efficient Long-Context Prefilling

LLMs waste compute on tokens that have already "figured it out" – DASH selectively skips these tokens during prefill, speeding things up without retraining or sacrificing accuracy.

Yujie Chen, Tailai Chen, Yifeng Gao +3

Inference & Quantization Scaling Laws & Emergent Abilities

Search

Zoe Wanying He

Research focus

Frequent co-authors

Papers (1)