Lattice AI Research

Research focus

Reasoning & Chain-of-Thought (2)Data Curation & Synthetic Data (1)Open-Source Models & Weights (1)Natural Language Processing (1)RLHF & Preference Learning (1)

Frequent co-authors

Zixian Huang (2)Xu Huang (1)Feiyang Hao (1)Qiming Ge (1)

Papers (2)

Mar 23, 2026

Mar 23, 2026·also DUT, NJU

How to Fine-Tune a Reasoning Model? A Teacher-Student Cooperation Framework to Synthesize Student-Consistent SFT Data

Fine-tuning smaller reasoning models on data from larger models can backfire spectacularly unless you carefully match the stylistic nuances of the student.

Zixian Huang, Kaichen Yang, Xu Huang +4

Data Curation & Synthetic Data Open-Source Models & Weights Reasoning & Chain-of-Thought

Feb 25, 2026

Feb 25, 2026·also DUT, HKU, Shanghai AI Lab

ExpLang: Improved Exploration and Exploitation in LLM Reasoning with On-Policy Thinking Language Selection

Multilingual reasoning in LLMs isn't just about translation—it's a powerful knob for improving RL training by expanding the exploration space and boosting exploitation.

Changjiang Gao, Zixian Huang, Kaichen Yang +5

Natural Language Processing Reasoning & Chain-of-Thought RLHF & Preference Learning

Search

Kaichen Yang

Research focus

Frequent co-authors

Papers (2)