Lattice AI Research

Research focus

Tool Use & Agents (3)Eval Frameworks & Benchmarks (2)Red-Teaming & Adversarial Robustness (2)Code Generation & Program Synthesis (1)Multimodal Models (1)

Frequent co-authors

Lu Yan (2)Ruqi Zhang (1)Yuan Tao (1)Mehran Kafai (1)

Papers (3)

Mar 18, 2026

Mar 18, 2026·also Nanyang Normal University, Purdue

Who Tests the Testers? Systematic Enumeration and Coverage Audit of LLM Agent Tool Call Safety

Current LLM agent safety benchmarks are missing over 20% of unsafe behaviors, even after agents pass the benchmark.

Xuan Chen, Lu Yan, Ruqi Zhang

Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness Tool Use & Agents

Mar 17, 2026

Nanyang Normal UniversityMar 17, 2026·also CAS

When the Specification Emerges: Benchmarking Faithfulness Loss in Long-Horizon Coding Agents

Coding agents struggle to maintain faithfulness to specifications that emerge gradually over long interactions, losing significant implementation fidelity compared to single-shot specifications.

Lu Yan, Xuan Chen

Code Generation & Program Synthesis Eval Frameworks & Benchmarks Tool Use & Agents

Feb 24, 2026

Feb 24, 2026·also CAS

MemoPhishAgent: Memory-Augmented Multi-Modal LLM Agent for Phishing URL Detection

By dynamically orchestrating tools and recalling past reasoning, an LLM agent can boost phishing detection recall by 20% on real-world social media URLs.

Xuan Chen, Yuan Tao, Mehran Kafai +1

Multimodal Models Red-Teaming & Adversarial Robustness Tool Use & Agents

Search

Xuan Chen

Research focus

Frequent co-authors

Papers (3)