M. Ghavamzadeh

Papers on Lattice

Total citations

Topics

h-index

Research focus

Robotics & Embodied AI (1)Training Efficiency & Optimization (1)

Frequent co-authors

Mohammad Ghavamzadeh (1)Y. Engel (1)Yaakov Engel (1)Michal Valko (1)

Papers (1)

Apr 30, 2026

Apr 30, 2026·also Paris-Saclay, Qualcomm AI

Bayesian Policy Gradient and Actor-Critic Algorithms

By modeling policy gradients as Gaussian processes, this work dramatically reduces the sample complexity in reinforcement learning, offering faster convergence and uncertainty estimates at little extra cost.

M. Ghavamzadeh, Mohammad Ghavamzadeh, Y. Engel +239

Robotics & Embodied AI Training Efficiency & Optimization

Search

M. Ghavamzadeh

Research focus

Frequent co-authors

Papers (1)