Zifei Shan

Papers on Lattice

Total citations

Topics

h-index

Research focus

Eval Frameworks & Benchmarks (3)Tool Use & Agents (3)Code Generation & Program Synthesis (1)Open-Source Models & Weights (1)

Frequent co-authors

Shuofei Qiao (2)Yi Zhong (1)Buqiang Xu (1)Yijun Wang (1)

Papers (3)

Apr 21, 2026

Yi Zhong +6Apr 21, 2026

Chat2Workflow: A Benchmark for Generating Executable Visual Workflows with Natural Language

LLMs are surprisingly bad at automating the creation of executable visual workflows from natural language, highlighting a significant gap in their ability to translate intent into reliable, deployable code.

Yi Zhong, Buqiang Xu, Yijun Wang +4

Code Generation & Program Synthesis Eval Frameworks & Benchmarks Tool Use & Agents

Apr 17, 2026

Apr 17, 2026·also NTU, Tencent AI

GTA-2: Benchmarking General Tool Agents from Atomic Tool-Use to Open-Ended Workflows

A stark capability cliff reveals that even leading AI models falter on complex workflows, achieving less than 15% success despite advancements in tool-use benchmarks.

Jize Wang, Xuanxuan Liu, Yining Li +7

Eval Frameworks & Benchmarks Tool Use & Agents

Feb 26, 2026

Feb 26, 2026·also DAMO, Meta AI, Tsinghua AI, Corresponding author +3

SkillNet: Create, Evaluate, and Connect AI Skills

AI agents can now learn durable skills instead of constantly "reinventing the wheel," thanks to SkillNet's infrastructure for creating, evaluating, and connecting AI skills at scale.

Yuanying Liang, R. Zhong, Haoming Xu +46

Eval Frameworks & Benchmarks Open-Source Models & Weights Tool Use & Agents

Search

Zifei Shan

Research focus

Frequent co-authors

Papers (3)