Deheng Ye

Papers on Lattice

Total citations

Topics

h-index

Research focus

RLHF & Preference Learning (1)Tool Use & Agents (1)Architecture Design (Transformers, SSMs, MoE) (1)Training Efficiency & Optimization (1)

Frequent co-authors

Zhicong Lu (1)Zichuan Lin (1)Wei Jia (1)Changyuan Tian (1)

Papers (2)

Mar 19, 2026

Zhicong Lu +9Mar 19, 2026

HISR: Hindsight Information Modulated Segmental Process Rewards For Multi-turn Agentic Reinforcement Learning

Aligning rewards with sub-goals and emphasizing key trajectory segments with hindsight information significantly improves multi-turn agentic RL, outperforming existing methods on complex tasks.

Zhicong Lu, Zichuan Lin, Wei Jia +7

RLHF & Preference Learning Tool Use & Agents

Feb 12, 2026

Tsinghua AIFeb 12, 2026·also Tencent AI

Temporal Difference Learning with Constrained Initial Representations

Constraining initial state representations with a simple Tanh activation and skip connections can significantly boost off-policy RL performance, rivaling more complex methods on continuous control tasks.

Jiafei Lyu, Jingwen Yang, Zhongjian Qiao +3

Architecture Design (Transformers, SSMs, MoE)Training Efficiency & Optimization

Search

Deheng Ye

Research focus

Frequent co-authors

Papers (2)