Xiang He

Papers on Lattice

Total citations

Topics

h-index

Research focus

Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)Speech & Audio (1)Eval Frameworks & Benchmarks (1)Tool Use & Agents (1)

Frequent co-authors

Chenxing Li (1)Jinting Wang (1)Yan Rong (1)Tianxin Xie (1)

Papers (2)

Apr 20, 2026

Xiang He +7Apr 20, 2026·also HKUST

Audio-DeepThinker: Progressive Reasoning-Aware Reinforcement Learning for High-Quality Chain-of-Thought Emergence in Audio Language Models

Forget supervised fine-tuning: RL alone can unlock high-quality chain-of-thought reasoning in audio-language models, even starting from a model with no prior CoT capability.

Xiang He, Chenxing Li, Jinting Wang +5

Reasoning & Chain-of-Thought RLHF & Preference Learning Speech & Audio

Wentao Shi +13Apr 20, 2026

AJ-Bench: Benchmarking Agent-as-a-Judge for Environment-Aware Evaluation

Agent-as-a-Judge can outperform LLM-as-a-Judge in complex environments, but still struggles to reliably verify agent behavior, revealing a critical gap in current LLM-based agent evaluation.

Wentao Shi, Yu Wang, Yuyang Zhao +11

Eval Frameworks & Benchmarks Tool Use & Agents

Search

Xiang He

Research focus

Frequent co-authors

Papers (2)