Erhan Zhang

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

RLHF & Preference Learning (2)Tool Use & Agents (1)Training Efficiency & Optimization (1)Natural Language Processing (1)

Frequent co-authors

Yiqun Chen (2)Wei Yang (2)Xiaochi Wei (2)Yan Gao (2)

Papers (2)

May 26, 2026

Yiqun Chen +152w ago·also USTC, Xiaohongshu, Xidian

UnityMAS-O: A General RL Optimization Framework for LLM-Based Multi-Agent Systems

Stop hand-engineering your multi-agent LLM systems: UnityMAS-O lets you train them end-to-end with RL, unlocking surprisingly large gains, especially for smaller models.

Yiqun Chen, Wei Yang, Erhan Zhang +13

RLHF & Preference Learning Tool Use & Agents Training Efficiency & Optimization

2w ago·also USC, Xiaohongshu, ZJU

Tournament-GRPO: Group-Wise Tournament Rewards for Reinforcement Learning in Open-Ended Long-Form Generation

Stop relying on absolute LLM scores for RLHF: relative comparisons via tournaments yield significantly better rewards for long-form generation.

Zixuan Yang, Yiqun Chen, Wei Yang +7

Natural Language Processing RLHF & Preference Learning

Search

Erhan Zhang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)