Lattice AI Research

Research focus

Reasoning & Chain-of-Thought (2)Red-Teaming & Adversarial Robustness (1)RLHF & Preference Learning (1)Eval Frameworks & Benchmarks (1)Tool Use & Agents (1)

Frequent co-authors

Guangcheng Zhu (1)Bowen Song (1)Sharon Li (1)Haobo Wang (1)

Papers (2)

Apr 5, 2026

Shenzhi Yang +8Apr 5, 2026·also USTC, UW-Madison

Can LLMs Learn to Reason Robustly under Noisy Supervision?

RLVR models exhibit "Early Correctness Coherence" under noisy supervision, suggesting a surprising opportunity for self-correction via dynamic label refinement.

Shenzhi Yang, Guangcheng Zhu, Bowen Song +6

Reasoning & Chain-of-Thought Red-Teaming & Adversarial Robustness RLHF & Preference Learning

Mar 15, 2026

Tsinghua AIMar 15, 2026·also BJTU, RUC

AgentProcessBench: Diagnosing Step-Level Process Quality in Tool-Using Agents

Tool-using agents may seem capable, but they struggle to distinguish neutral actions from errors, highlighting a critical need for better step-level process understanding.

Shengda Fan, Xuyan Ye, Yupeng Huo +9

Eval Frameworks & Benchmarks Reasoning & Chain-of-Thought Tool Use & Agents

Search

Shenzhi Yang

Research focus

Frequent co-authors

Papers (2)