Leonardo Cesani

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Matteo Papini (1)Marcello Restelli (1)

Papers (1)

Mar 16, 2026

1d ago

How Log-Barrier Helps Exploration in Policy Optimization

Log-barrier regularization can provably rescue policy optimization from getting stuck in suboptimal regions by structurally enforcing exploration, without sacrificing sample complexity.

Leonardo Cesani, Matteo Papini, Marcello Restelli

RLHF & Preference Learning Training Efficiency & Optimization

Search

Leonardo Cesani

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)