Lattice AI Research

Research focus

Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)Data Curation & Synthetic Data (1)Tool Use & Agents (1)Training Efficiency & Optimization (1)

Frequent co-authors

Guojun Yin (2)Zihan Lin (1)Xiaohan Wang (1)Jie Cao (1)

Papers (2)

May 1, 2026

Zihan Lin +8May 1, 2026

ResRL: Boosting LLM Reasoning via Negative Sample Projection Residual Reinforcement Learning

LLMs can reason better and generate more diverse outputs by projecting negative samples onto a positive subspace during reinforcement learning.

Zihan Lin, Xiaohan Wang, Jie Cao +6

Reasoning & Chain-of-Thought RLHF & Preference Learning

Apr 15, 2026

$\pi$-Play: Multi-Agent Self-Play via Privileged Self-Distillation without External Data

Self-play can be dramatically improved by exploiting the "question construction path" it generates as privileged information for self-distillation, leading to 2-3x faster learning.

Yaocheng Zhang, Yuanheng Zhu, Yuanheng Zhu +8

Data Curation & Synthetic Data Tool Use & Agents Training Efficiency & Optimization+1

Search

Jiajun Chai

Research focus

Frequent co-authors

Papers (2)