Zhenhua Han

Papers on Lattice

Total citations

Topics

Research focus

Tool Use & Agents (2)Code Generation & Program Synthesis (1)Eval Frameworks & Benchmarks (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Jiahang Lin (3)Shichun Liu (3)Xuanjing Huang (3)Chengjun Pan (2)

Papers (3)

Apr 28, 2026

Apr 28, 2026·also PKU, Shanghai Qiji Zhifeng Co

Agentic Harness Engineering: Observability-Driven Automatic Evolution of Coding-Agent Harnesses

Coding agents can now evolve their own harnesses to outperform human-designed ones, thanks to a novel observability-driven approach.

Jiahang Lin, Shichun Liu, Chengjun Pan +6

Code Generation & Program Synthesis Eval Frameworks & Benchmarks Tool Use & Agents

Apr 21, 2026

Apr 21, 2026·also Corresponding author, Fudan, Shanghai AI Lab

EVPO: Explained Variance Policy Optimization for Adaptive Critic Utilization in LLM Post-Training

Learned critics in RLHF can actually *increase* variance and hurt performance in sparse-reward settings, but a simple explained variance metric can tell you when to ditch the critic and get better results.

Chengjun Pan, Shichun Liu, Jiahang Lin +6

RLHF & Preference Learning Training Efficiency & Optimization

Apr 15, 2026

Jiahang Lin +13Apr 15, 2026·also Fudan

MM-Doc-R1: Training Agents for Long Document Visual Question Answering through Multi-turn Reinforcement Learning

Multi-turn reinforcement learning gets a boost: weighting trajectories by semantic similarity dramatically improves baseline estimation and agent performance in long-document visual QA.

Jiahang Lin, Kai Hu, Binghai Wang +11

Multimodal Models Recommendation & Information Retrieval Tool Use & Agents

Search

Zhenhua Han

Research focus

Frequent co-authors

Papers (3)