Runmin Cong

Shandong University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Zongji Yu (1)Wenshui Luo (1)Yiliu Sun (1)Hao Fang (1)

Papers (1)

May 25, 2026

6d ago·also SDU, Shanghai AI Lab

Harmony in Diversity: Multi-domain Contrastive Policy Optimization for Large Reasoning Models

Cross-domain RL can actually *boost* reasoning in large models, if you use contrastive learning to transform harmful interference into beneficial knowledge transfer.

Zongji Yu, Wenshui Luo, Yiliu Sun +3

Reasoning & Chain-of-Thought RLHF & Preference Learning Training Efficiency & Optimization

Search

Runmin Cong

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)