Rui Mao

Achieve 50% parameter reduction in LLaMA-2-7B with minimal performance loss and no fine-tuning, thanks to a new global gating-based structured pruning method.

Ziyang Wang, Jiangfeng Xiao, Chuan Xiao +3

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Apr 7, 2026

Qimin Zhong +5Apr 7, 2026·also Shenzhen University

Toward Consistent World Models with Multi-Token Prediction and Latent Semantic Enhancement

LLMs can develop more consistent world models by predicting multiple tokens *and* anchoring those predictions to ground-truth hidden state trajectories, mitigating structural hallucinations.

Qimin Zhong, Hao Liao, Haiming Qin +3

Architecture Design (Transformers, SSMs, MoE)Training Efficiency & Optimization World Models & Planning

Search

Rui Mao

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)