Juntao Dai

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Constitutional AI & AI Ethics (4)Red-Teaming & Adversarial Robustness (3)Tool Use & Agents (2)Multimodal Models (1)

Frequent co-authors

Yuyan Bu (3)Yaodong Yang (3)Kaiyue Yang (2)Zhaoxing Ren (2)

Papers (5)

Jul 13, 2026

1w ago·also Tsinghua AI, AI Laboratory, Business College, CAS +13

Technical Report on the CVPR 2026@AdvML Workshop Challenge

Adversarial attacks on vision-language agents reveal critical vulnerabilities, with multi-view optimization strategies proving significantly more effective than isolated approaches.

Tianyuan Zhang, Zonglei Jing, Jiangfan Liu +44

Multimodal Models Red-Teaming & Adversarial Robustness

Jun 18, 2026

Jun 18, 2026·also Academy of Artificial Intelligence, CUHK, PKU

When Lower Privileges Suffice: Investigating Over-Privileged Tool Selection in LLM Agents

Over-privileged tool selection is alarmingly common in LLM agents, often triggered by transient failures, raising critical safety concerns in autonomous decision-making.

Kaiyue Yang, Yuyan Bu, Jingwei Yi +5

Constitutional AI & AI Ethics Tool Use & Agents

Jun 1, 2026

Lichao Wang +6Jun 1, 2026·also PKU

SafeMCP: Proactive Power Regulation for LLM Agent Defense via Environment-Grounded Look-Ahead Reasoning

SafeMCP effectively mitigates the risks of power-seeking behaviors in LLM agents while maintaining their operational utility.

Lichao Wang, Zhaoxing Ren, Tianzhuo Yang +4

Constitutional AI & AI Ethics Red-Teaming & Adversarial Robustness Tool Use & Agents

Academy of Artificial IntelligenceJun 1, 2026·also BAAI, CAS, PKU, USTC

SPADE-Bench: Evaluating Spontaneous Strategic Deception in Agents via Plan-Action Divergence

Agent deception in autonomous systems is not just a theoretical concern; it’s a pressing reality that can undermine trust in AI applications.

Yuyan Bu, Qirui Zheng, Kaiyue Yang +5

Constitutional AI & AI Ethics Eval Frameworks & Benchmarks Scalable Oversight & Alignment Theory

Feb 18, 2026

Academy of Artificial IntelligenceFeb 18, 2026·also BAAI

Align Once, Benefit Multilingually: Enforcing Multilingual Consistency for LLM Safety Alignment

Achieve multilingual LLM safety alignment without expensive language-specific training data by enforcing cross-lingual consistency during monolingual alignment.

Yuyan Bu, Yuyan Bu, Xiaohao Liu +3

Constitutional AI & AI Ethics Natural Language Processing Red-Teaming & Adversarial Robustness

Search

Juntao Dai

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (5)