Shahriar Golchin

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Constitutional AI & AI Ethics (1)Eval Frameworks & Benchmarks (1)Red-Teaming & Adversarial Robustness (1)

Frequent co-authors

Marc Wetter (1)

Papers (1)

Feb 17, 2026

Shahriar Golchin +13w ago

Intent Laundering: AI Safety Datasets Are Not What They Seem

Stripping away obvious "triggering cues" from adversarial attacks reveals that current AI safety datasets drastically overestimate model robustness, turning "safe" models like Gemini 3 Pro and Claude Sonnet 3.7 into easy targets.

Shahriar Golchin, Marc Wetter

Constitutional AI & AI Ethics Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness

Search

Shahriar Golchin

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)