L

Zhejiang University

Papers on Lattice

Total citations

Topics

h-index

Research focus

RLHF & Preference Learning (1)Tool Use & Agents (1)Training Efficiency & Optimization (1)

Frequent co-authors

Weize Liu (1)Minghui Liu (1)Sy-Tuyen Ho (1)Souradip Chakraborty (1)

Papers (1)

Mar 9, 2026

Mar 9, 2026·also UMD

Agentic Critical Training

Instead of imitating reflections, LLM agents can be trained to reason about action quality by rewarding correct judgments between alternative actions, leading to improved performance and generalization.

L, Weize Liu, Minghui Liu +5

RLHF & Preference Learning Tool Use & Agents Training Efficiency & Optimization

Search

L

Research focus

Frequent co-authors

Papers (1)