Wang Bill Zhu

University of Southern California

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Eval Frameworks & Benchmarks (3)Tool Use & Agents (2)Reasoning & Chain-of-Thought (1)Code Generation & Program Synthesis (1)

Frequent co-authors

Qiutong Tony Yi (1)Jesse Thomason (1)Miaosen Chai (1)Shangshang Wang (1)

Papers (3)

Apr 20, 2026

5d ago

PDDL-Mind: Large Language Models are Capable on Belief Reasoning with Reliable State Tracking

LLMs can achieve significant gains in theory-of-mind reasoning by leveraging explicit state representations, challenging the notion that their limitations are solely due to reasoning capabilities.

Wang Bill Zhu, Qiutong Tony Yi, Jesse Thomason

Eval Frameworks & Benchmarks Reasoning & Chain-of-Thought Tool Use & Agents

Apr 19, 2026

6d ago·also Microsoft Research, UofT

Precise Debugging Benchmark: Is Your Model Debugging or Regenerating?

Despite impressive unit test pass rates, today's best LLMs rewrite code instead of precisely debugging it, achieving less than 45% edit precision even when explicitly instructed to minimize changes.

Wang Bill Zhu, Miaosen Chai, Shangshang Wang +4

Code Generation & Program Synthesis Eval Frameworks & Benchmarks

Apr 13, 2026

1w ago·also UC Santa Barbara

Self-Evolving LLM Memory Extraction Across Heterogeneous Tasks

Existing self-evolving prompt optimization frameworks falter when faced with the diverse memory demands of heterogeneous tasks, but a new clustering-based approach, CluE, restores generalization performance.

Yuqing Yang, Tengxiao Liu, Wangrong Zhu +4

Data Curation & Synthetic Data Eval Frameworks & Benchmarks Natural Language Processing+1

Search

Wang Bill Zhu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)