Yijun Zhu

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Training Efficiency & Optimization (1)

Frequent co-authors

Jianxin Wang (1)Chengchao Shen (1)

Papers (1)

Mar 9, 2026

Yijun Zhu +21w ago

High-Fidelity Pruning for Large Language Models

LLMs can be pruned more effectively by considering the information entropy of their output distribution, surpassing the limitations of traditional cross-entropy-based Taylor pruning.

Yijun Zhu, Jianxin Wang, Chengchao Shen

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Yijun Zhu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)