Michael Noukhovitch

Papers on Lattice

Total citations

Topics

Research focus

Distributed Systems & Hardware (1)Training Efficiency & Optimization (1)

Frequent co-authors

Homayoun Honari (1)Homayoun Honari (1)Roger Creus Castanyer (1)Roger Creus Castanyer (1)

Papers (1)

Mar 2, 2026

Homayoun Honari +10Mar 2, 2026

Align and Filter: Improving Performance in Asynchronous On-Policy RL

Overcome policy lag in distributed RL with TV-ACPO, a method that aligns advantage functions and constrains policy updates, leading to more robust and scalable on-policy learning.

Homayoun Honari, Homayoun Honari, Roger Creus Castanyer +8

Distributed Systems & Hardware Training Efficiency & Optimization

Search

Michael Noukhovitch

Research focus

Frequent co-authors

Papers (1)