Zongqing Lu

School of Computer Science, Peking University dmksjfl@gmail.com, li.xiu@sz.tsinghua.edu.cn

Tsinghua AI

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Training Efficiency & Optimization (1)

Frequent co-authors

Jiafei Lyu (1)Jingwen Yang (1)Zhongjian Qiao (1)Runze Liu (1)

Papers (1)

Feb 12, 2026

Tsinghua AIFeb 12, 2026·also Tencent AI

Temporal Difference Learning with Constrained Initial Representations

Constraining initial state representations with a simple Tanh activation and skip connections can significantly boost off-policy RL performance, rivaling more complex methods on continuous control tasks.

Jiafei Lyu, Jingwen Yang, Zhongjian Qiao +3

Architecture Design (Transformers, SSMs, MoE)Training Efficiency & Optimization

Search

Zongqing Lu

Research focus

Frequent co-authors

Papers (1)