Lattice AI Research

Research focus

Natural Language Processing (2)RLHF & Preference Learning (2)Architecture Design (Transformers, SSMs, MoE) (1)Training Efficiency & Optimization (1)

Frequent co-authors

Zhuohang Li (1)Sheng-Yen Chou (1)Claire Cardie (1)Sheng-Yen Chou (1)

Papers (2)

May 21, 2026

May 21, 2026·also Vanderbilt

Token-weighted Direct Preference Optimization with Attention

Attention from your LLM can be used to significantly improve preference optimization, outperforming existing methods without needing a separate reward model or heuristic token weighting.

Chengyu Huang, Zhuohang Li, Sheng-Yen Chou +1

Architecture Design (Transformers, SSMs, MoE)Natural Language Processing RLHF & Preference Learning

Apr 21, 2026

Apr 21, 2026·also CUHK

Bootstrapping Post-training Signals for Open-ended Tasks via Rubric-based Self-play on Pre-training Text

Forget expensive human annotation: this self-play method lets LLMs bootstrap their own training signals for open-ended tasks by generating rubrics to evaluate their own outputs.

Chengyu Huang, Sheng-Yen Chou, Zhengxin Zhang +1

Natural Language Processing RLHF & Preference Learning Training Efficiency & Optimization

Search

Chengyu Huang

Research focus

Frequent co-authors

Papers (2)