Yichi Zhang

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Constitutional AI & AI Ethics (3)Red-Teaming & Adversarial Robustness (2)Eval Frameworks & Benchmarks (1)Tool Use & Agents (1)

Frequent co-authors

Yinpeng Dong (2)Nabeel Seedat (1)Yi Dong (1)Yinpeng Dong (1)

Papers (3)

Mar 3, 2026

Yichi Zhang +51w ago

Guideline-Grounded Evidence Accumulation for High-Stakes Agent Verification

LLM agents in high-stakes domains can be verified more reliably by accumulating evidence grounded in expert guidelines, achieving a 12% AUROC improvement and 50% Brier score reduction over existing methods.

Yichi Zhang, Nabeel Seedat, Yi Dong +3

Constitutional AI & AI Ethics Eval Frameworks & Benchmarks Tool Use & Agents

Sep 2, 2025

Tsinghua AISep 2, 2025·also Case Western, NTU

Oyster-I: Beyond Refusal - Constructive Safety Alignment for Responsible Language Models

LLMs can move beyond simple refusals to actively guide vulnerable users towards safe outcomes, achieving state-of-the-art safety and robustness against jailbreaks.

Ranjie Duan, Jiexi Liu, Xiaojun Jia +2712

Constitutional AI & AI Ethics Red-Teaming & Adversarial Robustness RLHF & Preference Learning

Apr 14, 2025

Yichi Zhang +5Apr 14, 2025

RealSafe-R1: Safety-Aligned DeepSeek-R1 without Compromising Reasoning Capability

RealSafe-R1 achieves safety alignment of DeepSeek-R1 without sacrificing reasoning performance, a common trade-off in prior safety alignment efforts.

Yichi Zhang, Zihao Zeng, Dongbai Li +346

Constitutional AI & AI Ethics Open-Source Models & Weights Red-Teaming & Adversarial Robustness

Search

Yichi Zhang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)