Lattice AI Research

Research focus

Red-Teaming & Adversarial Robustness (2)Natural Language Processing (1)Constitutional AI & AI Ethics (1)RLHF & Preference Learning (1)

Frequent co-authors

Xun Huang (1)Simeng Qin (1)Simeng Qin (1)Xiaoshuang Jia (1)

Papers (2)

Feb 26, 2026

Feb 26, 2026·also DAMO, NUS, Tsinghua AI, Beihang +6

Obscure but Effective: Classical Chinese Jailbreak Prompt Optimization via Bio-Inspired Search

Classical Chinese, with its conciseness and obscurity, unlocks a surprisingly effective attack vector against LLM safety filters, and can be automatically exploited via bio-inspired optimization.

Xun Huang, Simeng Qin, Simeng Qin +10

Natural Language Processing Red-Teaming & Adversarial Robustness

Sep 2, 2025

Sep 2, 2025·also Tsinghua AI, HKU, NTU, PKU

Oyster-I: Beyond Refusal - Constructive Safety Alignment for Responsible Language Models

LLMs can move beyond simple refusals to actively guide vulnerable users towards safe outcomes, achieving state-of-the-art safety and robustness against jailbreaks.

Ranjie Duan, Jiexi Liu, Xiaojun Jia +2712

Constitutional AI & AI Ethics Red-Teaming & Adversarial Robustness RLHF & Preference Learning