Amy Zhang

UT Austin

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (2)Inference & Quantization (1)RLHF & Preference Learning (1)

Frequent co-authors

Li Jiang (1)Haoran Xu (1)Yichuan Ding (1)Kaiwen Hu (1)

Papers (2)

Jun 7, 2026

Mila2d ago·also McGill, UT Austin, ZJU

Trajectory-Refined Distillation

Prefix failure in on-policy distillation can be effectively mitigated by correcting problematic prefixes, leading to significant improvements in reasoning coverage and accuracy.

Li Jiang, Haoran Xu, Yichuan Ding +1

Inference & Quantization Training Efficiency & Optimization

Apr 15, 2026

Kaiwen Hu +2Apr 15, 2026·also UT Austin

Reinforcement Learning via Value Gradient Flow

Forget policy gradients: Value Gradient Flow (VGF) offers a simpler, more scalable way to align LLMs by directly optimizing value functions via optimal transport.

Kaiwen Hu, Somayeh Sojoudi, Amy Zhang

RLHF & Preference Learning Training Efficiency & Optimization

Search

Amy Zhang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)