Chengchao Shen

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Inference & Quantization (2)Training Efficiency & Optimization (1)Computer Vision (1)

Frequent co-authors

Yijun Zhu (1)Jianxin Wang (1)

Papers (2)

Mar 9, 2026

Yijun Zhu +21w ago

High-Fidelity Pruning for Large Language Models

LLMs can be pruned more effectively by considering the information entropy of their output distribution, surpassing the limitations of traditional cross-entropy-based Taylor pruning.

Yijun Zhu, Jianxin Wang, Chengchao Shen

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Chengchao Shen1w ago

Adaptive MLP Pruning for Large Vision Transformers

Achieve near lossless 40% parameter and FLOPs reduction in large vision transformers like CLIP and DINOv2 without finetuning, thanks to adaptive MLP pruning.

Chengchao Shen

Architecture Design (Transformers, SSMs, MoE)Computer Vision Inference & Quantization

Search

Chengchao Shen

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)