Lattice AI Research

Research focus

Data Curation & Synthetic Data (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)Eval Frameworks & Benchmarks (1)Robotics & Embodied AI (1)

Frequent co-authors

Xiaojie Wang (2)Qi Lin (1)Hengtong Lu (1)Huixing Jiang (1)

Papers (2)

Apr 11, 2025

Apr 11, 2025·also Kuaishou, Li Auto

Data with High and Consistent Preference Difference Are Better for Reward Model

Stop wasting compute on noisy preference data: filtering your RLHF datasets by "Preference Difference" boosts reward model accuracy and alignment performance.

Qi Lin, Hengtong Lu, Caixia Yuan +3

Data Curation & Synthetic Data RLHF & Preference Learning Training Efficiency & Optimization

Feb 27, 2025

Feb 27, 2025·also CUHK

Collab-Overcooked: Benchmarking and Evaluating Large Language Models as Collaborative Agents

LLMs struggle to actively collaborate and continuously adapt in complex, interactive environments, despite showing proficiency in goal interpretation.

Haochen Sun, Shuwen Zhang, Lei Ren +411

Eval Frameworks & Benchmarks Robotics & Embodied AI Tool Use & Agents

Search

Caixia Yuan

Research focus

Frequent co-authors

Papers (2)