Xiusheng Huang

B and

Papers on Lattice

Total citations

Topics

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Reasoning & Chain-of-Thought (1)

Frequent co-authors

Wenhui Tan (1)Xiaoqian Ma (1)Siqi Fan (1)Liujie Zhang (1)

Papers (1)

May 26, 2026

May 26, 2026·also B and, UESTC, Xiaohongshu

Pair-In, Pair-Out: Latent Multi-Token Prediction for Efficient LLMs

LLMs can be sped up by over 2x without sacrificing accuracy, by compressing the input and predicting multiple output tokens at once using a unified framework.

Wenhui Tan, Xiaoqian Ma, Siqi Fan +4

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Reasoning & Chain-of-Thought

Search

Xiusheng Huang

Research focus

Frequent co-authors

Papers (1)