Lattice AI Research

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Reasoning & Chain-of-Thought (1)Inference & Quantization (1)Natural Language Processing (1)Training Efficiency & Optimization (1)

Frequent co-authors

Shouren Wang (1)Wang Yang (1)Chuang Ma (1)Debargha Ganguly (1)

Papers (2)

Apr 29, 2026

Apr 29, 2026·also Kyoto, Michigan State, NII

Path-Lock Expert: Separating Reasoning Mode in Hybrid Thinking via Architecture-Level Separation

Hybrid-thinking LLMs can be dramatically improved by simply separating the feed-forward pathways for reasoning and non-reasoning modes, leading to less leakage and better accuracy.

Shouren Wang, Wang Yang, Chuang Ma +6

Architecture Design (Transformers, SSMs, MoE)Reasoning & Chain-of-Thought

Apr 9, 2026

Feng Luo +8Apr 9, 2026·also Case Western

Demystifying OPD: Length Inflation and Stabilization Strategies for Large Language Models

On-policy distillation can lead to catastrophic length inflation in student models, but a simple fix stabilizes training and boosts performance by 7%.

Feng Luo, Yu-Neng Chuang, Guanchu Wang +6

Inference & Quantization Natural Language Processing Training Efficiency & Optimization

Search

Xiaotian Han

Research focus

Frequent co-authors

Papers (2)