Saiteja Utpala

Papers on Lattice

Total citations

Topics

h-index

Research focus

Eval Frameworks & Benchmarks (1)Red-Teaming & Adversarial Robustness (1)Tool Use & Agents (1)

Frequent co-authors

Stephan Rabanser (1)Stephan Rabanser (1)Sayash Kapoor (1)Sayash Kapoor (1)

Papers (1)

Feb 18, 2026

Towards a Science of AI Agent Reliability

Despite progress in AI agent capabilities, reliability across crucial dimensions like consistency and robustness remains stubbornly low, revealing a critical gap in current evaluation practices.

Stephan Rabanser, Stephan Rabanser, Sayash Kapoor +9

Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness Tool Use & Agents

Search

Saiteja Utpala

Research focus

Frequent co-authors

Papers (1)