Tshihao Tsu

Carleton University {lichang93, xuechao19, xiaodong.he}@jd.com {zhihaoxu, yarenzhang}@cmail.carleton.ca

Papers on Lattice

Total citations

Topics

h-index

Research focus

RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Chang Li (1)Yaren Zhang (1)Chao Xue (1)Xiaodong He (1)

Papers (1)

Mar 9, 2026

JD Explore AcademyMar 9, 2026·also JD.com

Fibration Policy Optimization

Achieve better token efficiency in LLM policy optimization by using a novel FiberPO objective whose Jacobian is block-diagonal over trajectories and reduces to identity on-policy.

Chang Li, Tshihao Tsu, Yaren Zhang +2

RLHF & Preference Learning Training Efficiency & Optimization

Search

Tshihao Tsu

Research focus

Frequent co-authors

Papers (1)