Lattice AI Research

Research focus

RLHF & Preference Learning (2)Architecture Design (Transformers, SSMs, MoE) (1)Training Efficiency & Optimization (1)Distributed Systems & Hardware (1)Tool Use & Agents (1)

Frequent co-authors

Zhuang Yuan (1)Yuexin Bian (1)Sihong He (1)Jie Feng (1)

Papers (2)

Apr 21, 2026

Zhuang Yuan +9Apr 21, 2026·also ZJU

Low-Rank Adaptation for Critic Learning in Off-Policy Reinforcement Learning

Freezing most of your critic network and only training a tiny LoRA adapter can dramatically improve off-policy RL performance and stability.

Zhuang Yuan, Yuexin Bian, Sihong He +7

Architecture Design (Transformers, SSMs, MoE)RLHF & Preference Learning Training Efficiency & Optimization

Mar 19, 2026

Hao Zhang +13Mar 19, 2026·also NVIDIA

ProRL Agent: Rollout-as-a-Service for RL Training of Multi-Turn LLM Agents

Training multi-turn LLM agents just got easier: ProRL Agent offers a scalable, API-driven rollout service that streamlines RL training across diverse tasks.

Hao Zhang, Mingjie Liu, Shaokun Zhang +11

Distributed Systems & Hardware RLHF & Preference Learning Tool Use & Agents

Search

Songyang Han

Research focus

Frequent co-authors

Papers (2)