Donghyun Son

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Training Efficiency & Optimization (1)

Frequent co-authors

Minsoo Cheong (1)Minsoo Cheong (1)Donghyun Son (1)Woosang Lim (1)

Papers (1)

Mar 19, 2026

Minsoo Cheong +6Mar 19, 2026

EntropyCache: Decoded Token Entropy Guided KV Caching for Diffusion Language Models

Diffusion language models can achieve up to 26x inference speedups with almost no accuracy loss, thanks to a clever entropy-based KV caching strategy that avoids costly full forward passes.

Minsoo Cheong, Minsoo Cheong, Donghyun Son +4

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Donghyun Son

Research focus

Frequent co-authors

Papers (1)