Jianfei Chen

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (4)Training Efficiency & Optimization (4)Architecture Design (Transformers, SSMs, MoE) (3)Computer Vision (1)

Frequent co-authors

Jintao Zhang (3)Kai Jiang (2)Rundong Su (1)Zhihang Yuan (1)

Papers (4)

Mar 19, 2026

Tsinghua AIMar 19, 2026

6Bit-Diffusion: Inference-Time Mixed-Precision Quantization for Video Diffusion Models

Video diffusion models can be aggressively quantized down to 6-bit precision with minimal quality loss by dynamically adapting the bit-width of each layer based on its temporal stability.

Rundong Su, Jintao Zhang, Zhihang Yuan +2

Computer Vision Inference & Quantization Training Efficiency & Optimization

Mar 9, 2026

Weiyu Huang +3Mar 9, 2026

Deterministic Differentiable Structured Pruning for Large Language Models

Ditch the stochasticity: Deterministic pruning slashes LLM size with minimal performance loss, outperforming stochastic methods and accelerating inference.

Weiyu Huang, Pengle Zhang, Xiaolu Zhang +1

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Feb 13, 2026

Tsinghua AIFeb 13, 2026·also BAIR

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

SpargeAttention2 achieves 95% attention sparsity in video diffusion models with a 16.2x speedup, proving that trainable sparse attention can significantly outperform training-free methods without sacrificing generation quality.

Jintao Zhang, Jintao Zhang, Kai Jiang +7

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Tsinghua AIFeb 13, 2026·also BAIR

SLA2: Sparse-Linear Attention with Learnable Routing and QAT

Achieve an 18.6x speedup in video diffusion models with 97% attention sparsity by learning how to route and combine sparse and linear attention, outperforming heuristic approaches.

Jintao Zhang, Haoxu Wang, Kai Jiang +5

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Jianfei Chen

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (4)