Leilei Wen

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Constitutional AI & AI Ethics (1)Multimodal Models (1)Red-Teaming & Adversarial Robustness (1)

Frequent co-authors

Zhihua Wei (1)Jian Ruan (1)Zhenxin Qin (1)Dongrui Liu (1)

Papers (1)

Mar 18, 2026

Zhihua Wei +52w ago

Understanding and Defending VLM Jailbreaks via Jailbreak-Related Representation Shift

VLMs don't fail to *recognize* harmful intent when jailbroken; instead, visual inputs *shift* their internal representations into a distinct "jailbreak state," opening a new avenue for defense.

Zhihua Wei, Jian Ruan, Zhenxin Qin +3

Constitutional AI & AI Ethics Multimodal Models Red-Teaming & Adversarial Robustness

Search

Leilei Wen

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)