Lattice AI Research

Research focus

Eval Frameworks & Benchmarks (2)Code Generation & Program Synthesis (1)Tool Use & Agents (1)Data Curation & Synthetic Data (1)

Frequent co-authors

Bowen Wang (1)Dunjie Lu (1)Junli Wang (1)Tianyi Bai (1)

Papers (2)

May 25, 2026

DAMO6d ago·also Tsinghua AI, HKU

CUA-Gym: Scaling Verifiable Training Environments and Tasks for Computer-Use Agents

Forget hand-crafted benchmarks: CUA-Gym's auto-generated training data lets computer-use agents crush existing open-source models on real-world tasks.

Bowen Wang, Dunjie Lu, Junli Wang +10

Code Generation & Program Synthesis Eval Frameworks & Benchmarks Tool Use & Agents

Feb 15, 2026

DAMOFeb 15, 2026·also MIT CSAIL, Tsinghua AI, BJTU, Fudan +1

HLE-Verified: A Systematic Verification and Structured Revision of Humanity's Last Exam

LLM benchmark accuracy jumps 10% when evaluated on a cleaned-up version of Humanity's Last Exam, highlighting the significant impact of dataset noise on performance metrics.

Weiqi Zhai, Weiqi Zhai, Zhihai Wang +48

Data Curation & Synthetic Data Eval Frameworks & Benchmarks Natural Language Processing

Que Shen

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)

Search

Que Shen

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)