Basel Shbita

IBM Research ,University of Southern California, Information Sciences Institute

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (1)Natural Language Processing (1)RLHF & Preference Learning (1)

Frequent co-authors

Asmita Bhardwaj (1)Yuya Jeremy Ong (1)Eelaaf Zahid (1)

Papers (1)

Mar 19, 2026

1w ago

Adaptive Decoding via Test-Time Policy Learning for Self-Improving Generation

Forget fixed decoding strategies – RL can learn a lightweight policy to adapt LLM sampling *at test time*, boosting summarization quality by up to 88% without retraining the LLM.

Asmita Bhardwaj, Yuya Jeremy Ong, Eelaaf Zahid +1

Inference & Quantization Natural Language Processing RLHF & Preference Learning

Search

Basel Shbita

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)