Sanmi Koyejo

Stanford University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Eval Frameworks & Benchmarks (3)Red-Teaming & Adversarial Robustness (2)Constitutional AI & AI Ethics (1)Natural Language Processing (1)

Frequent co-authors

Anka Reuel (2)Michael Hardy (2)Suhana Bedi (1)Bridget Lin (1)

Papers (5)

Jun 8, 2026

Stanford HAI1w ago·also DeepMind

CARE: A Conformal Safety Layer for Medical Summarization

Calibrated safety flags in medical summaries can reduce unflagged omissions by up to 5 times compared to existing methods, enhancing clinician confidence in LLM outputs.

Suhana Bedi, Bridget Lin, Anson Y. Zhou +5

Constitutional AI & AI Ethics Natural Language Processing

Stanford HAI1w ago·also ETH, Mila, MIT CSAIL, AISI +27

Evaluation Cards: An Interpretive Layer for AI Evaluation Reporting

Systematic gaps in AI evaluation reporting are exposed, revealing inconsistencies that hinder reliable comparisons across thousands of models and benchmarks.

Avijit Ghosh, Anka Reuel, Jenny Chim +43

Eval Frameworks & Benchmarks

Jun 6, 2026

Stanford HAI1w ago·also DTU, UIUC

When Behavioral Safety Evaluation Fails: A Representation-Level Perspective

Behavioral safety metrics can mask significant latent vulnerabilities, with dissociated models revealing a stark contrast between outward behavior and internal robustness.

Enyi Jiang, Anders Gjølbye, Yibo Jacky Zhang +1

Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness

May 24, 2026

Stanford HAI3w ago

AI Cartography: Mapping the Latent Landscape of AI Benchmark Ecosystems

Leaderboard rankings are more noise than signal: contributor metadata matters more than architecture, and scaling laws are unreliable.

Michael Hardy, Anka Reuel, Lijin Zhang +6

Eval Frameworks & Benchmarks Open-Source Models & Weights

May 21, 2026

Stanford HAI3w ago·also BAIR, NUS, Simons, TTIC

The Distillation Game: Adaptive Attacks & Efficient Defenses

Adaptive evaluation exposes a substantial vulnerability gap, revealing that existing defenses may underestimate the capabilities of distillation attacks.

Youssef Allouah, Mahdi Haghifam, Sanmi Koyejo +1

Inference & Quantization Red-Teaming & Adversarial Robustness

Search

Sanmi Koyejo

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (5)