Wanxiang Che

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (5)Tool Use & Agents (3)Eval Frameworks & Benchmarks (3)Code Generation & Program Synthesis (2)

Frequent co-authors

Qingfu Zhu (5)Tianhao Niu (4)Dingzirui Wang (2)Keyan Xu (2)

Papers (7)

Jul 7, 2026

Dingzirui Wang +42w ago

CurateEvo: Data-Curation Evolving for Agentic Post-Training

CurateEvo transforms data curation from a static process into a dynamic, failure-driven evolution, significantly boosting performance and efficiency in LLM training.

Dingzirui Wang, Xuanliang Zhang, Keyan Xu +2

Data Curation & Synthetic Data Tool Use & Agents

Jul 6, 2026

2w ago

What You See Is What You Get: Observation-Aligned Supervision for Chart-to-Code Generation

Observation-Aligned supervision reveals that traditional chart-to-code training often leads to hallucinations, and aligning targets with identifiable quantities can dramatically improve model performance.

Tianhao Niu, Qingfu Zhu, Wanxiang Che

Code Generation & Program Synthesis Multimodal Models

2w ago

Dashboard2Code: Evaluating Multimodal Models on Reconstructing Interactive Dashboards

Even the best multimodal models struggle to reconstruct complex interactive dashboards, revealing a critical gap in current capabilities.

Tianhao Niu, Ziyu Han, Qiguang Chen +5

Code Generation & Program Synthesis Multimodal Models

Jun 10, 2026

When Does Language Matter? Multilingual Instructions Reveal Step-wise Language Sensitivity in Vision-Language-Action Models

Language sensitivity in VLA models is a step-wise control problem, with certain task steps causing up to 50% performance degradation under non-English instructions.

Xuan Dong, Zhe Han, Tianhao Niu +2

Multimodal Models Natural Language Processing Robotics & Embodied AI

May 28, 2026

Dingzirui Wang +3May 28, 2026

Scaling Laws for Agent Harnesses via Effective Feedback Compute

Stop blindly throwing compute at agent harnesses: effective feedback, not raw tokens, dictates scaling laws.

Dingzirui Wang, Keyan Xu, Qingfu Zhu +1

Eval Frameworks & Benchmarks Scaling Laws & Emergent Abilities Tool Use & Agents

Apr 22, 2026

Apr 22, 2026·also Beihang, Fudan, HKU

OMIBench: Benchmarking Olympiad-Level Multi-Image Reasoning in Large Vision-Language Model

Even the best large vision-language models struggle with multi-image reasoning, scoring only 50% on a new benchmark designed to challenge their capabilities.

Chengyu Luan, Jiajun Wu, Qiming Yu +4

Eval Frameworks & Benchmarks Multimodal Models Reasoning & Chain-of-Thought

Apr 7, 2026

EpiBench: Benchmarking Multi-turn Research Workflows for Multimodal Agents

Current multimodal agents are surprisingly bad at research workflows, struggling to integrate evidence across papers and figures in multi-turn settings.

Xuan Dong, Huanyang Zheng, Tianhao Niu +6

Eval Frameworks & Benchmarks Multimodal Models Tool Use & Agents

Search

Wanxiang Che

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (7)