Shivchander Sudalairaj

AI Innovation, DeCoDE Lab, Red Hat

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Scalable Oversight & Alignment Theory (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Giorgio Giannone (2)Akash Srivastava (2)Kai Xu (2)Mustafa Eyceoz (1)

Papers (2)

Jun 7, 2026

AI Innovation1w ago·also DeCoDE Lab, Red Hat

Intrinsic Selection and Particle Resampling for Inference-Time Scaling Beyond Domain Verifiability

Length-adjusted tail entropy can serve as a powerful signal for solution quality, enabling significant performance boosts in inference-time scaling across complex domains.

Giorgio Giannone, Mustafa Eyceoz, Shabana Baig +5

Scalable Oversight & Alignment Theory

AI Innovation1w ago·also DeCoDE Lab, IBM Research, Red Hat

sGPO: Trading Inference FLOPs for Training Efficiency in RLVR

Trading a fraction of inference compute for a threefold reduction in training costs, sGPO redefines efficiency in RLVR training.

Shivchander Sudalairaj, Kai Xu, Akash Srivastava +1

RLHF & Preference Learning Training Efficiency & Optimization

Search

Shivchander Sudalairaj

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)