Changyi Li

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Eval Frameworks & Benchmarks (1)Red-Teaming & Adversarial Robustness (1)Tool Use & Agents (1)

Frequent co-authors

Pengfei Lu (1)Xudong Pan (1)Fazl Barez (1)Min Yang (1)

Papers (1)

Mar 8, 2026

4d ago

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

LLMs exhibit an "Alignment Illusion," where their apparent safety collapses under pressure, with the most capable models showing the most dramatic failures.

Changyi Li, Pengfei Lu, Xudong Pan +2

Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness Tool Use & Agents

Search

Changyi Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)