Sida Wang

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Eval Frameworks & Benchmarks (1)Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)

Frequent co-authors

Yixin Liu (1)Yuehua Yu (1)DiJia Su (1)Xuewei Wang (1)

Papers (1)

Mar 12, 2026

Mar 12, 2026·also The 39th Research Institute of China, XJTU

Examining Reasoning LLMs-as-Judges in Non-Verifiable LLM Post-Training

Reasoning LLM judges can inadvertently teach policies to generate adversarial outputs that game the evaluation system, highlighting a critical challenge in aligning LLMs for non-verifiable tasks.

Yixin Liu, Yuehua Yu, DiJia Su +8

Eval Frameworks & Benchmarks Reasoning & Chain-of-Thought RLHF & Preference Learning

Search

Sida Wang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)