Mohammad Ghavamzadeh

Qualcomm AI Research

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)Robotics & Embodied AI (1)Training Efficiency & Optimization (1)

Frequent co-authors

Yuanxin Liu (1)Ruida Zhou (1)Xinyan Zhao (1)Amr Sharaf (1)

Papers (2)

Jun 17, 2026

3w ago·also Dolby Germany GmbH, Qualcomm AI, UMN

REVES: REvision and VErification--Augmented Training for Test-Time Scaling

By focusing on correcting "near-miss" answers, REVES achieves a remarkable +6.5 point improvement over standard RL methods, showcasing a new way to enhance LLM reasoning without extensive computational costs.

Yuanxin Liu, Ruida Zhou, Xinyan Zhao +4

Reasoning & Chain-of-Thought RLHF & Preference Learning

Apr 30, 2026

Apr 30, 2026·also INRIA, Paris-Saclay

Bayesian Policy Gradient and Actor-Critic Algorithms

By modeling policy gradients as Gaussian processes, this work dramatically reduces the sample complexity in reinforcement learning, offering faster convergence and uncertainty estimates at little extra cost.

Mohammad Ghavamzadeh, M. Ghavamzadeh, Y. Engel +239

Robotics & Embodied AI Training Efficiency & Optimization

Search

Mohammad Ghavamzadeh

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)