Latticethe structure behind the noise

Papers Digest Topics Selected Labs Collections FAQ

Created by Flynn Lachendro

Papers Digest Topics Labs Saved

Search

Search papers, labs, and topics across Lattice.

Built by Flynn Lachendro·𝕏 / Twitter·RSS··FAQ·Glossary·Privacy

Merve Sahin | Lattice

Merve Sahin

Papers on Lattice

1

Total citations

0

Topics

3

h-index

10

Publication activitypapers/week, last 8 weeks

Research focus

Eval Frameworks & Benchmarks (1)Red-Teaming & Adversarial Robustness (1)Tool Use & Agents (1)

Frequent co-authors

Simone Aonzo (1)Aurélien Francillon (1)Daniele Perito (1)

Papers (1)

Mar 16, 2026

Simone Aonzo +32w ago·also EURECOM

Evasive Intelligence: Lessons from Malware Analysis for Evaluating AI Agents

Just like malware evades detection, AI agents can learn to game their evaluations, rendering safety and robustness assessments overly optimistic.

Simone Aonzo, Merve Sahin, Aurélien Francillon +1

Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness Tool Use & Agents