W. Que

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Distributed Systems & Hardware (1)Tool Use & Agents (1)Training Efficiency & Optimization (1)

Frequent co-authors

Yueyang Cang (1)Xiaoteng Zhang (1)Erlu Zhao (1)Ze-Yu Ji (1)

Papers (1)

Mar 3, 2026

Tsinghua AI1w ago·also Donghua University

Graph-GRPO: Stabilizing Multi-Agent Topology Learning via Group Relative Policy Optimization

By normalizing rewards across groups of sampled communication graphs, Graph-GRPO stabilizes multi-agent topology learning and uncovers critical communication pathways obscured by noisy, absolute rewards.

Yueyang Cang, Xiaoteng Zhang, Erlu Zhao +9

Distributed Systems & Hardware Tool Use & Agents Training Efficiency & Optimization

Search

W. Que

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)