Dong Yu

Papers on Lattice

Total citations

Topics

h-index

Research focus

Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)Speech & Audio (1)

Frequent co-authors

Xiang He (1)Chenxing Li (1)Jinting Wang (1)Yan Rong (1)

Papers (1)

Apr 20, 2026

Xiang He +7Apr 20, 2026·also HKUST

Audio-DeepThinker: Progressive Reasoning-Aware Reinforcement Learning for High-Quality Chain-of-Thought Emergence in Audio Language Models

Forget supervised fine-tuning: RL alone can unlock high-quality chain-of-thought reasoning in audio-language models, even starting from a model with no prior CoT capability.

Xiang He, Chenxing Li, Jinting Wang +5

Reasoning & Chain-of-Thought RLHF & Preference Learning Speech & Audio

Search

Dong Yu

Research focus

Frequent co-authors

Papers (1)