Wenkai Yu

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Eval Frameworks & Benchmarks (1)Reasoning & Chain-of-Thought (1)Tool Use & Agents (1)

Frequent co-authors

Qijie You (1)

Papers (1)

Feb 22, 2026

Qijie You +13w ago

AgenticRAGTracer: A Hop-Aware Benchmark for Diagnosing Multi-Step Retrieval Reasoning in Agentic RAG

Even GPT-5 only achieves 22.6% accuracy on the hardest part of this new Agentic RAG benchmark, revealing a surprising brittleness in multi-hop reasoning.

Qijie You, Wenkai Yu

Eval Frameworks & Benchmarks Reasoning & Chain-of-Thought Tool Use & Agents

Search

Wenkai Yu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)