Song Yu

Southwest University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Reasoning & Chain-of-Thought (2)RLHF & Preference Learning (2)Computer Vision (1)Multimodal Models (1)

Frequent co-authors

Li Li (1)Wenwen Zhao (1)Zhisheng Yang (1)Yang Hu (1)

Papers (3)

May 6, 2026

2w ago

EP-GRPO: Entropy-Progress Aligned Group Relative Policy Optimization with Implicit Process Guidance

GRPO's credit assignment failures—treating all tokens as equally important and misaligning step-level rewards—can be overcome with a self-supervised approach that mines the model's intrinsic information flow.

Song Yu, Li Li, Wenwen Zhao +1

Reasoning & Chain-of-Thought RLHF & Preference Learning

Apr 20, 2026

Apr 20, 2026·also Central South University, School of Computer Science and Engineering

Exploring Boundary-Aware Spatial-Frequency Fusion for Camouflaged Object Detection

BASFNet reveals that integrating frequency domain insights with spatial features can dramatically enhance camouflaged object detection performance.

Song Yu, Yang Hu, Haokang Ding +2

Computer Vision Multimodal Models

Mar 30, 2026

ERPO: Token-Level Entropy-Regulated Policy Optimization for Large Reasoning Models

LLMs can reason more accurately and concisely when RL is guided by token-level entropy, pinpointing and exploring "forks in the road" during the reasoning process.

Song Yu

Reasoning & Chain-of-Thought RLHF & Preference Learning Training Efficiency & Optimization

Search

Song Yu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)