Changyuan Tian

Papers on Lattice

Total citations

Topics

h-index

Research focus

RLHF & Preference Learning (1)Tool Use & Agents (1)

Frequent co-authors

Zhicong Lu (1)Zichuan Lin (1)Wei Jia (1)Deheng Ye (1)

Papers (1)

Mar 19, 2026

Zhicong Lu +9Mar 19, 2026

HISR: Hindsight Information Modulated Segmental Process Rewards For Multi-turn Agentic Reinforcement Learning

Aligning rewards with sub-goals and emphasizing key trajectory segments with hindsight information significantly improves multi-turn agentic RL, outperforming existing methods on complex tasks.

Zhicong Lu, Zichuan Lin, Wei Jia +7

RLHF & Preference Learning Tool Use & Agents

Search

Changyuan Tian

Research focus

Frequent co-authors

Papers (1)