Yarin Gal

OATML, University of Oxford

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Red-Teaming & Adversarial Robustness (2)Constitutional AI & AI Ethics (1)Scientific Discovery & Drug Design (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Lin Li (1)Qi Zhang (1)Xander Davies (1)Jianing Qiu (1)

Papers (2)

Jun 8, 2026

3d ago·also MBZUAI

Gaming AI-Assisted Peer Reviews Poses New Risks to the Scientific Community

Superficial rephrasing can inflate AI peer review scores by over 1.3 points, revealing a dangerous vulnerability in AI-assisted scientific evaluation.

Lin Li, Qi Zhang, Xander Davies +2

Constitutional AI & AI Ethics Red-Teaming & Adversarial Robustness Scientific Discovery & Drug Design

Feb 16, 2026

Giorgi Giglemiani +3Feb 16, 2026·also Oxford

Boundary Point Jailbreaking of Black-Box LLMs

A fully automated black-box attack, Boundary Point Jailbreaking, can reliably bypass even state-of-the-art classifier-based LLM safety filters, without needing gradients, scores, or human-generated seeds.

Giorgi Giglemiani, Edmund Lau, Geoffrey Irving +1

Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness

Search

Yarin Gal

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)