Takayuki Osa

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Training Efficiency & Optimization (1)

Frequent co-authors

Naoki Shitanda (1)Naoki Shitanda (1)Motoki Omura (1)Motoki Omura (1)

Papers (1)

Mar 2, 2026

2w ago

Rethinking Policy Diversity in Ensemble Policy Gradient in Large-Scale Reinforcement Learning

Taming policy diversity with KL constraints unlocks surprisingly stable and sample-efficient ensemble reinforcement learning in high-dimensional manipulation tasks.

Naoki Shitanda, Naoki Shitanda, Motoki Omura +5

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

Search

Takayuki Osa

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)