Chaojun Xiao

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (3)Architecture Design (Transformers, SSMs, MoE) (2)Multimodal Models (2)Inference & Quantization (2)

Frequent co-authors

Tianyu Yu (2)Junbo Cui (1)Bokai Xu (1)Chongyi Wang (1)

Papers (4)

Apr 30, 2026

MiniCPM-o Team1d ago·also Tsinghua AI

MiniCPM-o 4.5: Towards Real-Time Full-Duplex Omni-Modal Interaction

Forget turn-based interactions: MiniCPM-o 4.5 achieves real-time, full-duplex omni-modal interaction, letting it see, listen, speak, and even proactively comment on its environment, all at Gemini-level performance but a fraction of the size.

Junbo Cui, Bokai Xu, Chongyi Wang +33

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Open-Source Models & Weights

Tsinghua AI1d ago·also CAS, HKUST, NTU, RUC +1

PRISM: Pre-alignment via Black-box On-policy Distillation for Multimodal Reinforcement Learning

Multimodal models forget how to see and reason after SFT, but PRISM realigns them before RL, boosting performance by up to 6%.

Sudong Wang, Weiquan Huang, Xiaomin Yu +9

Multimodal Models RLHF & Preference Learning Training Efficiency & Optimization

Apr 14, 2026

Tsinghua AI2w ago·also MiniCPM-o Team

Rethinking On-Policy Distillation of Large Language Models: Phenomenology, Mechanism, and Recipe

OPD's "free lunch" of dense token-level reward may be an illusion, as teacher novelty, not just higher scores, drives successful distillation.

Yuxin Zuo, Yuxin Zuo, Bingxiang He +9

Inference & Quantization Natural Language Processing Training Efficiency & Optimization

Feb 12, 2026

Tsinghua AIFeb 12, 2026·also HUST, Ministry of Education Key Laboratory of Intelligent Networks and Network Security, Tongji, UC Santa Cruz +1

MiniCPM-SALA: Hybridizing Sparse and Linear Attention for Efficient Long-Context Modeling

Forget full attention: a hybrid sparse-linear attention model, MiniCPM-SALA, achieves 3.5x faster inference and supports 1M context length on a single GPU, all while maintaining comparable performance.

MiniCPM Team Wenhao An, Yingfa Chen, Yewei Fang +34

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Chaojun Xiao

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (4)