Xiaorong Wang

Tsinghua University

Tsinghua AI

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Data Curation & Synthetic Data (1)Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)

Frequent co-authors

Xiaoyue Xu (1)Sikui Zhang (1)Xu Han (1)Chaojun Xiao (1)

Papers (1)

Jun 17, 2026

Tsinghua AI5d ago

Beyond Reward Engineering: A Data Recipe for Long-Context Reinforcement Learning

A simple data recipe can outperform traditional reinforcement learning methods, yielding significant improvements in long-context reasoning for large language models.

Xiaoyue Xu, Sikui Zhang, Xiaorong Wang +2

Data Curation & Synthetic Data Reasoning & Chain-of-Thought RLHF & Preference Learning

Search

Xiaorong Wang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)