Guangnian Wan

Papers on Lattice

Total citations

Topics

Research focus

Constitutional AI & AI Ethics (1)Natural Language Processing (1)Red-Teaming & Adversarial Robustness (1)

Frequent co-authors

Xinyin Ma (1)Gongfan Fang (1)

Papers (1)

Mar 9, 2026

Guangnian Wan +2Mar 9, 2026·also NUS, Corresponding Author

Invisible Safety Threat: Malicious Finetuning for LLM via Steganography

LLMs can be finetuned to hide malicious prompts and responses in plain sight using steganography, bypassing safety filters and creating an "invisible safety threat."

Guangnian Wan, Xinyin Ma, Gongfan Fang

Constitutional AI & AI Ethics Natural Language Processing Red-Teaming & Adversarial Robustness

Search

Guangnian Wan

Research focus

Frequent co-authors

Papers (1)