Wenjie Luo

Papers on Lattice

Total citations

Topics

h-index

Research focus

Data Curation & Synthetic Data (2)Eval Frameworks & Benchmarks (2)Natural Language Processing (2)

Frequent co-authors

Weiqi Zhai (2)Yiyuan Li (2)Dayiheng Liu (2)Xiang Zheng (1)

Papers (2)

Mar 2, 2026

DAMOMar 2, 2026·also Cornell, Kuaishou

ClinConsensus: A Consensus-Based Benchmark for Evaluating Chinese Medical LLMs across Difficulty Levels

Despite achieving comparable overall scores, top-performing medical LLMs exhibit surprising differences in reasoning, evidence use, and longitudinal follow-up when evaluated on a new Chinese medical benchmark, revealing critical gaps in clinically actionable treatment planning.

Xiang Zheng, Han Li, Wenjie Luo +5

Data Curation & Synthetic Data Eval Frameworks & Benchmarks Natural Language Processing

Feb 15, 2026

DAMOFeb 15, 2026·also MIT CSAIL, Tsinghua AI, BJTU, Fudan +1

HLE-Verified: A Systematic Verification and Structured Revision of Humanity's Last Exam

LLM benchmark accuracy jumps 10% when evaluated on a cleaned-up version of Humanity's Last Exam, highlighting the significant impact of dataset noise on performance metrics.

Weiqi Zhai, Weiqi Zhai, Zhihai Wang +47

Data Curation & Synthetic Data Eval Frameworks & Benchmarks Natural Language Processing

Search

Wenjie Luo

Research focus

Frequent co-authors

Papers (2)