Zeming Wei

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Red-Teaming & Adversarial Robustness (2)Constitutional AI & AI Ethics (1)Natural Language Processing (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Yihao Zhang (1)Kai Wang (1)Jiangrong Wu (1)Haolin Wu (1)

Papers (2)

Apr 13, 2026

Yihao Zhang +91w ago·also SJTU

The Salami Slicing Threat: Exploiting Cumulative Risks in LLM Systems

LLMs can be jailbroken with 90% success by subtly "salami slicing" harmful intent across multiple turns, even against state-of-the-art models like GPT-4o and Gemini.

Yihao Zhang, Kai Wang, Jiangrong Wu +7

Constitutional AI & AI Ethics Natural Language Processing Red-Teaming & Adversarial Robustness

Mar 16, 2026

Southwest Medical UniversityMar 16, 2026·also HIT, Pengcheng Laboratory

TrinityGuard: A Unified Framework for Safeguarding Multi-Agent Systems

LLM-based multi-agent systems are riddled with 20 distinct risk types, from single-agent vulnerabilities to system-level emergent hazards, demanding a unified safety evaluation and monitoring framework.

Kai Wang, Biaojie Zeng, Zeming Wei +8

Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness Tool Use & Agents

Search

Zeming Wei

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)