Zhiqiang Shen

K, with 70% token merging ratio on Stable Diffusion 2.0, BiGain increases classification accuracy by 7.15% while also improving FID for generation by 0.34 (1.85%). Our comprehensive analyses indicate that balanced spectral retention, preserving high-frequency detail alongside low/mid-frequency semantic content is a reliable design rule for token compression in diffusion models. To our knowledge, BiGain is the first framework to jointly study and advance both generation and classification under accelerated diffusion, supporting lower-cost deployment of dual-purpose generative systems. **footnotetext: Equal contribution.

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Inference & Quantization (2)Computer Vision (1)Training Efficiency & Optimization (1)

Frequent co-authors

Shengkun Tang (1)Jiacheng Cui (1)Dongkuan Xu (1)Aidar Myrzakhan (1)

Papers (2)

Mar 12, 2026

BiGain: Unified Token Compression for Joint Generation and Classification

Token compression in diffusion models no longer has to sacrifice classification accuracy for faster generation – BiGain boosts both.

Shengkun Tang, Jiacheng Cui, Dongkuan Xu +1

Architecture Design (Transformers, SSMs, MoE)Computer Vision Inference & Quantization+1

Feb 19, 2026

VILA-LabFeb 19, 2026·also Aalborg, MBZUAI

Sink-Aware Pruning for Diffusion Language Models

Attention sinks, considered essential in autoregressive language models, turn out to be surprisingly prunable in diffusion language models, leading to better efficiency.

Aidar Myrzakhan, Aidar Myrzakhan, Tianyi Li +5

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Natural Language Processing

Search

Zhiqiang Shen

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)