Sayantani Dasgupta

Papers on Lattice

Total citations

Topics

h-index

Research focus

Inference & Quantization (1)Natural Language Processing (1)Training Efficiency & Optimization (1)

Frequent co-authors

Sayantan Dasgupta (1)Trevor Cohn (1)Timothy Baldwin (1)Timothy Baldwin (1)

Papers (1)

Feb 24, 2026

Feb 24, 2026·also IIIT-Delhi, MBZUAI

Don't Ignore the Tail: Decoupling top-K Probabilities for Efficient Language Model Distillation

Distilling language models just got more efficient: a new loss function focuses on the long tail of token probabilities, boosting performance without extra compute.

Sayantani Dasgupta, Sayantan Dasgupta, Trevor Cohn +2

Inference & Quantization Natural Language Processing Training Efficiency & Optimization

Search

Sayantani Dasgupta

Research focus

Frequent co-authors

Papers (1)