Danush Khanna

Manipal University

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Training Efficiency & Optimization (1)

Frequent co-authors

Aditya Kumar Guru (1)Srivarshinee Sridhar (1)Zidan Ahmed (1)Rubhav Bahirwani (1)

Papers (1)

Jun 27, 2025

Manipal UniversityJun 27, 2025·also Amazon Science, Meta AI, Stanford HAI, IITP

QuickSilver - Speeding up LLM Inference through Dynamic Token Halting, KV Skipping, Contextual Token Fusion, and Adaptive Matryoshka Quantization

Achieve up to 39.6% FLOP reduction in LLM inference without retraining or architectural changes using QuickSilver's dynamic token-level optimizations.

Danush Khanna, Aditya Kumar Guru, Srivarshinee Sridhar +7

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Danush Khanna

Research focus

Frequent co-authors

Papers (1)