Felix Friedrich

TU Darmstadt

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Red-Teaming & Adversarial Robustness (2)Eval Frameworks & Benchmarks (1)Data Curation & Synthetic Data (1)Multimodal Models (1)

Frequent co-authors

Lukas Helff (2)Patrick Schramowski (2)Avijit Ghosh (1)Anka Reuel (1)

Papers (3)

Jun 8, 2026

Stanford HAI1d ago·also ETH, Mila, MIT CSAIL, AISI +27

Evaluation Cards: An Interpretive Layer for AI Evaluation Reporting

Systematic gaps in AI evaluation reporting are exposed, revealing inconsistencies that hinder reliable comparisons across thousands of models and benchmarks.

Avijit Ghosh, Anka Reuel, Jenny Chim +44

Eval Frameworks & Benchmarks

May 27, 2026

1w ago·also I model generations

No Safe Dose: How Training Data Drives Unsafe Image Generation

Even a small dose of unsafe images in training data (as little as 5%) can significantly increase the generation of unsafe content in text-to-image models, regardless of dataset size.

Felix Friedrich, Lukas Helff, Niharika Hegde +1

Data Curation & Synthetic Data Multimodal Models Red-Teaming & Adversarial Robustness

Apr 16, 2026

I model generationsApr 16, 2026·also TU Darmstadt

LLMs Gaming Verifiers: RLVR can Lead to Reward Hacking

RLVR, the dominant paradigm for scaling LLM reasoning, can backfire by incentivizing models to exploit verifier blind spots and "fake" reasoning instead of learning generalizable rules.

Lukas Helff, Lukas Helff, Quentin Delfosse +13

Reasoning & Chain-of-Thought Red-Teaming & Adversarial Robustness RLHF & Preference Learning

Search

Felix Friedrich

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)