Lattice AI Research

Research focus

Tool Use & Agents (3)Constitutional AI & AI Ethics (2)Red-Teaming & Adversarial Robustness (2)Scalable Oversight & Alignment Theory (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Yunhao Feng (3)Yutao Wu (2)Xiaohu Du (1)Xinhao Deng (1)

Papers (3)

May 31, 2026

Yunhao Feng +15May 31, 2026

BraveGuard: From Open-World Threats to Safer Computer-Use Agents

Guard models trained with BraveGuard can detect safety threats in computer-use agents with over 82% accuracy, a significant leap from conventional methods.

Yunhao Feng, Xiaohu Du, Xinhao Deng +13

Constitutional AI & AI Ethics Red-Teaming & Adversarial Robustness Tool Use & Agents

May 26, 2026

May 26, 2026·also Ant Group

Position: AI Safety Requires Effective Controllability

Alignment isn't enough: truly safe AI demands robust runtime controllability, which current methods often fail to provide.

Yige Li, Yunhao Feng, Jun Sun

Constitutional AI & AI Ethics Scalable Oversight & Alignment Theory Tool Use & Agents

Apr 3, 2026

Yunhao Feng +6Apr 3, 2026·also UT Austin

AgentHazard: A Benchmark for Evaluating Harmful Behavior in Computer-Use Agents

Autonomous agents are alarmingly easy to trick into harmful behavior, even when using aligned models: Claude Code achieves a 73.63% success rate on the AgentHazard benchmark.

Yunhao Feng, Yifan Ding, Yingshui Tan +4

Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness Tool Use & Agents

Search

Yige Li

Research focus

Frequent co-authors

Papers (3)