C. Cardie

Papers on Lattice

Total citations

Topics

h-index

Research focus

Natural Language Processing (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Chengyu Huang (1)Sheng-Yen Chou (1)Zhengxin Zhang (1)

Papers (1)

Apr 21, 2026

Apr 21, 2026·also CUHK

Bootstrapping Post-training Signals for Open-ended Tasks via Rubric-based Self-play on Pre-training Text

Forget expensive human annotation: this self-play method lets LLMs bootstrap their own training signals for open-ended tasks by generating rubrics to evaluate their own outputs.

Chengyu Huang, Sheng-Yen Chou, Zhengxin Zhang +1

Natural Language Processing RLHF & Preference Learning Training Efficiency & Optimization

Search

C. Cardie

Research focus

Frequent co-authors

Papers (1)