Yihua Zhu

Kyoto University, NII LLMC

Papers on Lattice

Total citations

Topics

Research focus

Eval Frameworks & Benchmarks (1)Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)

Frequent co-authors

Qianying Liu (1)Jiaxin Wang (1)Akiko Aizawa (1)Sadao Kurohashi (1)

Papers (1)

May 26, 2026

May 26, 2026·also NII, Shanghai Innovation, UTokyo

Reasoning Depth and Environment Complexity: A Controlled Study of RLVR Data Allocation across Logical Reasoning Tasks

RL models trained with verifiable rewards exhibit a surprising deductive-over-abductive reasoning asymmetry, even in controlled environments, suggesting a fundamental challenge in current RLVR approaches.

Yihua Zhu, Qianying Liu, Jiaxin Wang +3

Eval Frameworks & Benchmarks Reasoning & Chain-of-Thought RLHF & Preference Learning

Search

Yihua Zhu

Research focus

Frequent co-authors

Papers (1)