Yujiong Shen

Papers on Lattice

Total citations

Topics

Research focus

Eval Frameworks & Benchmarks (2)Natural Language Processing (1)Scientific Discovery & Drug Design (1)Tool Use & Agents (1)

Frequent co-authors

Tao Gui (2)Xuanjing Huang (2)Shihan Dou (1)Chenhao Huang (1)

Papers (2)

Apr 29, 2026

Tsinghua AIApr 29, 2026·also CAS, Fudan, RUC, Xidian

CL-bench Life: Can Language Models Learn from Real-Life Context?

Today's best language models can barely make sense of your messy group chats and fragmented digital life, achieving only 19% accuracy on a new benchmark of real-world reasoning.

Shihan Dou, Yujiong Shen, Chenhao Huang +31

Eval Frameworks & Benchmarks Natural Language Processing

Feb 13, 2026

Feb 13, 2026·also Fudan

SciAgentGym: Benchmarking Multi-Step Scientific Tool-use in LLM Agents

GPT-5's scientific reasoning skills plummet by nearly 50% when tackling multi-step workflows, revealing a critical gap in current LLM agents' ability to orchestrate complex tool use.

Yujiong Shen, Yajie Yang, Zhiheng Xi +11

Eval Frameworks & Benchmarks Scientific Discovery & Drug Design Tool Use & Agents

Search

Yujiong Shen

Research focus

Frequent co-authors

Papers (2)