Yikai Zhang

Papers on Lattice

Total citations

Topics

h-index

Research focus

Training Efficiency & Optimization (2)Code Generation & Program Synthesis (2)Eval Frameworks & Benchmarks (2)Tool Use & Agents (2)Natural Language Processing (1)

Frequent co-authors

Kenan Li (2)Qirui Jin (2)Liao Zhu (2)Xiaosong Huang (2)

Papers (4)

Apr 13, 2026

Tsinghua AIApr 13, 2026

The Past Is Not Past: Memory-Enhanced Dynamic Reward Shaping

LLMs can learn to avoid repeating mistakes by remembering and penalizing frequently recurring error patterns in past rollouts.

Enxi Wang, Yufei Gao, Weixin Zhang +3

Natural Language Processing RLHF & Preference Learning Training Efficiency & Optimization

Apr 9, 2026

Microsoft ResearchApr 9, 2026·also Georgia Tech, Virginia Tech

ORACLE-SWE: Quantifying the Contribution of Oracle Information Signals on SWE Agents

Knowing the *perfect* API to use or *exact* location to edit could drastically improve SWE agent performance, but knowing the perfect regression test result? Not so much.

Kenan Li, Qirui Jin, Liao Zhu +15

Code Generation & Program Synthesis Eval Frameworks & Benchmarks Tool Use & Agents

Mar 11, 2026

Yikai Zhang +6Mar 11, 2026

$V_{0.5}$: Generalist Value Model as a Prior for Sparse RL Rollouts

Forget hand-tuning rollout budgets: $V_{0.5}$ dynamically allocates compute to sparse RL rollouts based on a real-time statistical test of a generalist value model's prior, slashing variance and boosting performance.

Yikai Zhang, Yueqing Sun, Hongyan Hao +4

Robotics & Embodied AI Training Efficiency & Optimization World Models & Planning

Mar 5, 2026

Mar 5, 2026·also Microsoft Research, KU, RIKEN, Shanghai AI Lab +1

RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

Automating software repository build and testing across languages and platforms is now possible, unlocking scalable benchmarking and training for coding agents.

Kenan Li, Rongzhi Li, Qirui Jin +14

Code Generation & Program Synthesis Eval Frameworks & Benchmarks Tool Use & Agents

Search

Yikai Zhang

Research focus

Frequent co-authors

Papers (4)