Lattice AI Research

Research focus

Natural Language Processing (2)Training Efficiency & Optimization (2)Constitutional AI & AI Ethics (1)RLHF & Preference Learning (1)Inference & Quantization (1)

Frequent co-authors

Shiwan Zhao (1)Zhihu Wang (1)Xu Zhao (1)Xuyang Zhao (1)

Papers (2)

Apr 9, 2026

Nankai UniversityApr 9, 2026·also XJTU

Large Language Model Post-Training: A Unified View of Off-Policy and On-Policy Learning

LLM post-training isn't just about objectives; it's about strategically intervening on model behavior through support expansion, policy reshaping, and behavioral consolidation.

Shiwan Zhao, Zhihu Wang, Xu Zhao +12

Constitutional AI & AI Ethics Natural Language Processing RLHF & Preference Learning+1

Feng Luo +8Apr 9, 2026·also Case Western

Demystifying OPD: Length Inflation and Stabilization Strategies for Large Language Models

On-policy distillation can lead to catastrophic length inflation in student models, but a simple fix stabilizes training and boosts performance by 7%.

Feng Luo, Yu-Neng Chuang, Guanchu Wang +6

Inference & Quantization Natural Language Processing Training Efficiency & Optimization

Search

Zicheng Xu

Research focus

Frequent co-authors

Papers (2)