Yuyan Bu

Academy of Artificial Intelligence

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Constitutional AI & AI Ethics (3)Tool Use & Agents (1)Eval Frameworks & Benchmarks (1)Scalable Oversight & Alignment Theory (1)

Frequent co-authors

Juntao Dai (3)Kaiyue Yang (2)Yaodong Yang (2)Jingwei Yi (1)

Papers (3)

Jun 18, 2026

Jun 18, 2026·also Academy of Artificial Intelligence, CUHK, PKU

When Lower Privileges Suffice: Investigating Over-Privileged Tool Selection in LLM Agents

Over-privileged tool selection is alarmingly common in LLM agents, often triggered by transient failures, raising critical safety concerns in autonomous decision-making.

Kaiyue Yang, Yuyan Bu, Jingwei Yi +5

Constitutional AI & AI Ethics Tool Use & Agents

Jun 1, 2026

Academy of Artificial IntelligenceJun 1, 2026·also BAAI, CAS, PKU, USTC

SPADE-Bench: Evaluating Spontaneous Strategic Deception in Agents via Plan-Action Divergence

Agent deception in autonomous systems is not just a theoretical concern; it’s a pressing reality that can undermine trust in AI applications.

Yuyan Bu, Qirui Zheng, Kaiyue Yang +5

Constitutional AI & AI Ethics Eval Frameworks & Benchmarks Scalable Oversight & Alignment Theory

Feb 18, 2026

Academy of Artificial IntelligenceFeb 18, 2026·also BAAI

Align Once, Benefit Multilingually: Enforcing Multilingual Consistency for LLM Safety Alignment

Achieve multilingual LLM safety alignment without expensive language-specific training data by enforcing cross-lingual consistency during monolingual alignment.

Yuyan Bu, Yuyan Bu, Xiaohao Liu +3

Constitutional AI & AI Ethics Natural Language Processing Red-Teaming & Adversarial Robustness

Search

Yuyan Bu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)