Noah A. Smith

Papers on Lattice

Total citations

Topics

h-index

Research focus

Recommendation & Information Retrieval (1)Tool Use & Agents (1)World Models & Planning (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Nathan Lambert (2)Hanna Hajishirzi (2)Teng Xiao (1)Yige Yuan (1)

Papers (2)

Mar 11, 2026

AI2Mar 11, 2026·also UW

Meta-Reinforcement Learning with Self-Reflection for Agentic Search

Agentic search gets a meta-RL boost: MR-Search learns to self-reflect and adapt search strategies across episodes, significantly outperforming standard RL baselines.

Teng Xiao, Yige Yuan, Hamish Ivison +6

Recommendation & Information Retrieval Tool Use & Agents World Models & Planning

Jun 2, 2025

AI2Jun 2, 2025·also UW

RewardBench 2: Advancing Reward Model Evaluation

RewardBench 2 exposes a stark reality check for reward models: they struggle significantly on new, human-generated prompts, yet this difficulty is surprisingly predictive of their actual usefulness in downstream tasks.

Saumya Malik, Valentina Pyatkin, Sander Land +453

Eval Frameworks & Benchmarks RLHF & Preference Learning