Qingpeng Cai

Kuaishou Technology

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Reasoning & Chain-of-Thought (1)Recommendation & Information Retrieval (1)RLHF & Preference Learning (1)

Frequent co-authors

Jingtong Gao (1)Zeyu Song (1)Chi Lu (1)Xiaopeng Li (1)

Papers (1)

May 21, 2026

May 21, 2026·also Kuaishou

Reinforced Preference Optimization for Reasoning-Augmented Recommendations

Aligning LLM reasoning with a dedicated recommendation head via reinforcement learning yields state-of-the-art recommendation performance in real-world systems.

Jingtong Gao, Zeyu Song, Chi Lu +5

Reasoning & Chain-of-Thought Recommendation & Information Retrieval RLHF & Preference Learning

Search

Qingpeng Cai

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)