Naoki Shitanda

The University of Tokyo, Tokyo, Japan

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Training Efficiency & Optimization (1)

Frequent co-authors

Naoki Shitanda (1)Motoki Omura (1)Motoki Omura (1)Tatsuya Harada (1)

Papers (1)

Mar 2, 2026

Rethinking Policy Diversity in Ensemble Policy Gradient in Large-Scale Reinforcement Learning

Taming policy diversity with KL constraints unlocks surprisingly stable and sample-efficient ensemble reinforcement learning in high-dimensional manipulation tasks.

Naoki Shitanda, Naoki Shitanda, Motoki Omura +3

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

Search

Naoki Shitanda

Research focus

Frequent co-authors

Papers (1)