Jonas Dornbusch

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Natural Language Processing (1)Red-Teaming & Adversarial Robustness (1)Training Efficiency & Optimization (1)

Frequent co-authors

Chengzhi Hu (1)David Lüdke (1)Stephan Günnemann (1)Leo Schwinn (1)

Papers (1)

Feb 16, 2026

Closing the Distribution Gap in Adversarial Training for LLMs

LLMs can still be easily fooled by simple prompt rewrites because current adversarial training doesn't adequately cover the data distribution, but a new method using diffusion models closes this gap.

Chengzhi Hu, Jonas Dornbusch, David Lüdke +2

Natural Language Processing Red-Teaming & Adversarial Robustness Training Efficiency & Optimization

Search

Jonas Dornbusch

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)