Yijue Xu

Carnegie Mellon University

CMU Machine Learning

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (1)Scaling Laws & Emergent Abilities (1)

Frequent co-authors

Yujie Chen (1)Tailai Chen (1)Yifeng Gao (1)Zoe Wanying He (1)

Papers (1)

Apr 20, 2026

5d ago·also CMU ML, University of California

Stability Implies Redundancy: Delta Attention Selective Halting for Efficient Long-Context Prefilling

LLMs waste compute on tokens that have already "figured it out" – DASH selectively skips these tokens during prefill, speeding things up without retraining or sacrificing accuracy.

Yujie Chen, Tailai Chen, Yifeng Gao +4

Inference & Quantization Scaling Laws & Emergent Abilities

Search

Yijue Xu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)