Nick Haber

Stanford University

Stanford HAI

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Data Curation & Synthetic Data (1)Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)

Frequent co-authors

Violet Xiang (1)Amrith Setlur (1)Chase Blagden (1)Aviral Kumar (1)

Papers (1)

Jun 15, 2026

Stanford HAI4d ago·also CMU ML, OpenAI, Work done while at Rogo.

ExpRL: Exploratory RL for LLM Mid-Training

ExpRL outperforms traditional reinforcement learning methods by effectively rewarding intermediate reasoning steps, leading to better LLM performance on complex tasks.

Violet Xiang, Amrith Setlur, Chase Blagden +2

Data Curation & Synthetic Data Reasoning & Chain-of-Thought RLHF & Preference Learning

Search

Nick Haber

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)