Jiaqing Liang

ADaPT enables a single model to flexibly navigate the efficiency-performance trade-off, achieving significant cost savings without sacrificing reasoning quality.

Tingyun Li, Zishang Jiang, Jinyi Han +7

Reasoning & Chain-of-Thought Training Efficiency & Optimization

May 27, 2026

May 27, 2026·also School of Computer Science

ProRL: Effective Reinforcement Learning for Proactive Recommendation via Rectified Policy Gradient Estimation

Naive RL in recommender systems suffers from biased gradients that favor longer paths, but ProRL fixes this with a novel reward centering and advantage estimation scheme.

Hongru Hou, Tiehua Mei, Denghui Geng +4

Recommendation & Information Retrieval RLHF & Preference Learning

Apr 18, 2026

School of Computer ScienceApr 18, 2026·also College of Computer Science and Artificial

GenericAgent: A Token-Efficient Self-Evolving LLM Agent via Contextual Information Density Maximization (V1.0)

LLM agent performance hinges on maximizing decision-relevant information density within context, not just context length, and GenericAgent proves it.

Jiaqing Liang, Jinyi Han, Weijia Li +15

Reasoning & Chain-of-Thought Tool Use & Agents Training Efficiency & Optimization

Search

Jiaqing Liang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (4)