Yibo Zhao

East China Normal University

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Tool Use & Agents (4)Recommendation & Information Retrieval (2)Eval Frameworks & Benchmarks (2)RLHF & Preference Learning (2)

Frequent co-authors

Zichen Ding (2)Zhoumianze Liu (2)Bowen Zhou (2)Qin Cai (1)

Papers (5)

Jul 8, 2026

2w ago

Think Big, Search Small: Where Capacity Matters in Hierarchical Search Agents?

Concentrating model capacity on delegation roles can yield substantial performance gains in hierarchical search agents, revealing a critical bottleneck in task decomposition.

Qin Cai, Qinnan Cai, Yibo Zhao

Distributed Systems & Hardware Recommendation & Information Retrieval Scaling Laws & Emergent Abilities+1

Jun 21, 2026

Jun 21, 2026·also Tsinghua AI, AI Laboratory, ECNU, Fudan +2

MacAgentBench: Benchmarking AI Agents on Real-World macOS Desktop

CUAs can achieve a 73.7% success rate on complex macOS tasks, but the secret to their performance lies in skill libraries, not just framework design.

Yikun Fu, Bowen Fu, Shuang Cheng +6

Eval Frameworks & Benchmarks Tool Use & Agents

May 27, 2026

Skill0.5: Joint Skill Internalization and Utilization for Out-of-Distribution Generalization in Agentic Reinforcement Learning

Skill0.5 achieves state-of-the-art out-of-distribution generalization in agentic RL by intelligently combining skill internalization and utilization, outperforming methods that rely solely on one or the other.

Jiapeng Zhu, Jianxiang Yu, Yibo Zhao +6

RLHF & Preference Learning Robotics & Embodied AI Tool Use & Agents

Mar 19, 2026

Mar 19, 2026·also AI Laboratory, CUHK, ECNU, Fudan +2

OS-Themis: A Scalable Critic Framework for Generalist GUI Rewards

Decomposing GUI agent trajectories into verifiable milestones and auditing the evidence chain yields a 10% boost in RL training performance, outperforming single-judge reward systems.

Zhenyu Wu, Yibo Zhao, Yibo Zhao +17

RLHF & Preference Learning Robotics & Embodied AI Tool Use & Agents

Jan 27, 2026

Jan 27, 2026·also Harvard, HKUST

RATE: Reviewer Profiling and Annotation-free Training for Expertise Ranking in Peer Review Systems

Forget outdated benchmarks: LR-bench offers a fresh, 2024-2025-era dataset for reviewer assignment, and RATE leverages reviewer profiles for state-of-the-art matching.

Weicong Liu, Zi-Yi Yang, Yibo Zhao +1

Eval Frameworks & Benchmarks Natural Language Processing Recommendation & Information Retrieval