Liang Pang

Papers on Lattice

Total citations

Topics

h-index

Research focus

Tool Use & Agents (2)Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)Natural Language Processing (1)Recommendation & Information Retrieval (1)

Frequent co-authors

Jingcheng Deng (1)Zihao Wei (1)Junhong Wu (1)Shicheng Xu (1)

Papers (2)

Apr 30, 2026

Latent-GRPO: Group Relative Policy Optimization for Latent Reasoning

Latent reasoning can now outperform explicit reasoning in complex tasks, thanks to a new RL method that stabilizes training by explicitly handling issues like invalid latent states and misaligned token-level updates.

Jingcheng Deng, Zihao Wei, Liang Pang +4

Reasoning & Chain-of-Thought RLHF & Preference Learning Tool Use & Agents

Mar 30, 2026

Mar 30, 2026·also CAS

Learning to Retrieve from Agent Trajectories

Forget human clicks: training retrieval models directly from agent behavior unlocks significant gains in task success and efficiency for LLM-powered search agents.

Yuqi Zhou, Sunhao Dai, Changle Qu +3

Natural Language Processing Recommendation & Information Retrieval Tool Use & Agents

Search

Liang Pang

Research focus

Frequent co-authors

Papers (2)