Yongjiang Liu

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Eval Frameworks & Benchmarks (1)RLHF & Preference Learning (1)Tool Use & Agents (1)

Frequent co-authors

Sikai Bai (1)Sikai Bai (1)Haoxi Li (1)Jie Zhang (1)

Papers (1)

Apr 9, 2026

Sikai Bai +72w ago·also SEU

TTVS: Boosting Self-Exploring Reinforcement Learning via Test-time Variational Synthesis

Forget expensive labeled data: this method lets large reasoning models learn and outperform supervised RL by dynamically generating training data from unlabeled test queries.

Sikai Bai, Sikai Bai, Haoxi Li +5

Eval Frameworks & Benchmarks RLHF & Preference Learning Tool Use & Agents

Search

Yongjiang Liu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)