Dongxian Wu

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Constitutional AI & AI Ethics (1)Natural Language Processing (1)Red-Teaming & Adversarial Robustness (1)

Frequent co-authors

Yihao Zhang (1)Kai Wang (1)Jiangrong Wu (1)Haolin Wu (1)

Papers (1)

Apr 13, 2026

Yihao Zhang +91w ago·also SJTU

The Salami Slicing Threat: Exploiting Cumulative Risks in LLM Systems

LLMs can be jailbroken with 90% success by subtly "salami slicing" harmful intent across multiple turns, even against state-of-the-art models like GPT-4o and Gemini.

Yihao Zhang, Kai Wang, Jiangrong Wu +7

Constitutional AI & AI Ethics Natural Language Processing Red-Teaming & Adversarial Robustness

Search

Dongxian Wu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)