Wen Wang

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Training Efficiency & Optimization (1)

Frequent co-authors

Gongbo Zhang (1)Ye Tian (1)Li Yuan (1)

Papers (1)

Apr 29, 2026

3w ago

Turning the TIDE: Cross-Architecture Distillation for Diffusion Large Language Models

Shrinking diffusion LLMs by distilling across different architectures can yield surprisingly strong performance, even boosting code generation scores by 16 points on HumanEval.

Gongbo Zhang, Wen Wang, Ye Tian +1

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Wen Wang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)