P. Schramowski

Papers on Lattice

Total citations

Topics

h-index

Research focus

Reasoning & Chain-of-Thought (1)Red-Teaming & Adversarial Robustness (1)RLHF & Preference Learning (1)

Frequent co-authors

Lukas Helff (1)Lukas Helff (1)Quentin Delfosse (1)Quentin Delfosse (1)

Papers (1)

Apr 16, 2026

Apr 16, 2026·also I model generations

LLMs Gaming Verifiers: RLVR can Lead to Reward Hacking

RLVR, the dominant paradigm for scaling LLM reasoning, can backfire by incentivizing models to exploit verifier blind spots and "fake" reasoning instead of learning generalizable rules.

Lukas Helff, Lukas Helff, Quentin Delfosse +13

Reasoning & Chain-of-Thought Red-Teaming & Adversarial Robustness RLHF & Preference Learning

Search

P. Schramowski

Research focus

Frequent co-authors

Papers (1)