Lattice AI Research

Research focus

RLHF & Preference Learning (2)Reasoning & Chain-of-Thought (1)Training Efficiency & Optimization (1)Computer Vision (1)

Frequent co-authors

Yuqiao Tan (1)Minzheng Wang (1)Bo Liu (1)Zichen Liu (1)

Papers (2)

Apr 15, 2026

2w ago

From $P(y|x)$ to $P(y)$: Investigating Reinforcement Learning in Pre-train Space

LLMs can be made to reason much better by directly optimizing their pre-training output distribution, even before fine-tuning on specific tasks.

Yuqiao Tan, Minzheng Wang, Bo Liu +2

Reasoning & Chain-of-Thought RLHF & Preference Learning Training Efficiency & Optimization

Mar 12, 2026

Mar 12, 2026·also NTU

Trust Your Critic: Robust Reward Modeling and Reinforcement Learning for Faithful Image Editing and Generation

Hallucinations in RL-based image editing and generation are tamed with FIRM, a new framework that trains robust reward models on curated datasets to provide more accurate guidance.

Xiangyu Zhao, Peiyuan Zhang, Junming Lin +8

Computer Vision Multimodal Models RLHF & Preference Learning

Tian Liang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)

Search

Tian Liang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)