Wenhui Tan

Gaoling School of Artificial Intelligence, Renmin University of China

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Reasoning & Chain-of-Thought (2)Training Efficiency & Optimization (2)Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)

Frequent co-authors

Minghao Li (1)Xiaoqian Ma (1)Siqi Fan (1)Xiusheng Huang (1)

Papers (3)

May 26, 2026

3w ago·also B and, UESTC, Xiaohongshu, Xiaomi Corporation

Pair-In, Pair-Out: Latent Multi-Token Prediction for Efficient LLMs

LLMs can be sped up by over 2x without sacrificing accuracy, by compressing the input and predicting multiple output tokens at once using a unified framework.

Wenhui Tan, Minghao Li, Xiaoqian Ma +5

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Reasoning & Chain-of-Thought

Feb 26, 2026

Feb 26, 2026·also Cohere

MSJoE: Jointly Evolving MLLM and Sampler for Efficient Long-Form Video Understanding

By jointly training a keyframe sampler with an MLLM, MSJoE achieves state-of-the-art accuracy in long-form video understanding while significantly reducing computational cost.

Wenhui Tan, Xiaoyi Yu, Xiaoyi Yu +6

Computer Vision Multimodal Models Training Efficiency & Optimization

Feb 16, 2026

Fiorenzo Parascandolo +2Feb 16, 2026·also RUC

BFS-PO: Best-First Search for Large Reasoning Models

Stop paying for verbose overthinking: BFS-PO slashes LRM output length while simultaneously boosting accuracy.

Fiorenzo Parascandolo, Wenhui Tan, Enver Sangineto

Reasoning & Chain-of-Thought RLHF & Preference Learning Training Efficiency & Optimization