Peiyao Xiao

University at Buffalo

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Data Curation & Synthetic Data (1)Eval Frameworks & Benchmarks (1)Natural Language Processing (1)

Frequent co-authors

Weiqi Zhai (1)Weiqi Zhai (1)Zhihai Wang (1)Zhihai Wang (1)

Papers (1)

Feb 15, 2026

DAMO3w ago·also Fudan, UB

HLE-Verified: A Systematic Verification and Structured Revision of Humanity's Last Exam

LLM benchmark accuracy jumps 10% when evaluated on a cleaned-up version of Humanity's Last Exam, highlighting the significant impact of dataset noise on performance metrics.

Weiqi Zhai, Weiqi Zhai, Zhihai Wang +55

Data Curation & Synthetic Data Eval Frameworks & Benchmarks Natural Language Processing

Search

Peiyao Xiao

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)