Amrith Setlur

Carnegie Mellon University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Reasoning & Chain-of-Thought (2)RLHF & Preference Learning (2)Data Curation & Synthetic Data (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Violet Xiang (1)Chase Blagden (1)Nick Haber (1)Aviral Kumar (1)

Papers (3)

Jun 15, 2026

Stanford HAI2d ago·also CMU ML, OpenAI, Work done while at Rogo.

ExpRL: Exploratory RL for LLM Mid-Training

ExpRL outperforms traditional RL methods by using human-written data as reward scaffolds, enabling LLMs to learn more effectively from their reasoning processes.

Violet Xiang, Amrith Setlur, Chase Blagden +2

Data Curation & Synthetic Data Reasoning & Chain-of-Thought RLHF & Preference Learning

Apr 6, 2026

LM-Provers +6Apr 6, 2026·also CMU ML, HuggingFace

QED-Nano: Teaching a Tiny Model to Prove Hard Theorems

A 4B model can rival the mathematical reasoning of models 30x its size, proving that clever training trumps brute force scaling.

LM-Provers, Yuxiao Qu, Amrith Setlur +4

Eval Frameworks & Benchmarks Open-Source Models & Weights Reasoning & Chain-of-Thought

Mar 12, 2026

CMU MLMar 12, 2026·also Institute of Foundation Models (IFM), Petuum, University of Artificial Intelligence

IsoCompute Playbook: Optimally Scaling Sampling Compute for LLM RL

Forget simple scaling laws: the compute-optimal number of parallel rollouts in LLM RL plateaus, revealing distinct mechanisms for easy vs. hard problems.

Zhoujun Cheng, Yutao Xie, Yuxiao Qu +16

RLHF & Preference Learning Scaling Laws & Emergent Abilities Training Efficiency & Optimization

Search

Amrith Setlur

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)