Hu Wei

Alibaba Group

Papers on Lattice

Total citations

Topics

h-index

Research focus

Eval Frameworks & Benchmarks (2)Data Curation & Synthetic Data (1)Natural Language Processing (1)Multimodal Models (1)Scientific Discovery & Drug Design (1)

Frequent co-authors

Xiang Zheng (1)Han Li (1)Wenjie Luo (1)Weiqi Zhai (1)

Papers (2)

Mar 2, 2026

DAMOMar 2, 2026·also Cornell, Kuaishou

ClinConsensus: A Consensus-Based Benchmark for Evaluating Chinese Medical LLMs across Difficulty Levels

Despite achieving comparable overall scores, top-performing medical LLMs exhibit surprising differences in reasoning, evidence use, and longitudinal follow-up when evaluated on a new Chinese medical benchmark, revealing critical gaps in clinically actionable treatment planning.

Xiang Zheng, Han Li, Wenjie Luo +5

Data Curation & Synthetic Data Eval Frameworks & Benchmarks Natural Language Processing

Feb 26, 2026

Feb 26, 2026·also DAMO, Skylenage

SPM-Bench: Benchmarking Large Language Models for Scanning Probe Microscopy

LLMs still struggle with PhD-level scanning probe microscopy tasks, but SPM-Bench offers a new automated pipeline to generate challenging scientific benchmarks and quantify model "personalities" like "Conservative" or "Gambler."

Peiyao Xiao, P. Xiao, Xiaogang Li +12

Eval Frameworks & Benchmarks Multimodal Models Scientific Discovery & Drug Design

Search

Hu Wei

Research focus

Frequent co-authors

Papers (2)