Gaetan Peter

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Code Generation & Program Synthesis (1)Eval Frameworks & Benchmarks (1)Red-Teaming & Adversarial Robustness (1)

Frequent co-authors

Marc Damie (1)Murat Bilgehan Ertan (1)Domenico Essoussi (1)Angela Makhanu (1)

Papers (1)

Mar 11, 2026

5d ago·also CWI Amsterdam, Datadog, Erasmus University Rotterdam, Leiden

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

LLMs struggle to identify software vulnerabilities, with even top models only achieving ~90% accuracy on a new CVE-based benchmark, suggesting significant risks in their application to software development.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi +3

Code Generation & Program Synthesis Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness

Search

Gaetan Peter

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)