Zhengqiang Zhang

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Computer Vision (1)Inference & Quantization (1)

Frequent co-authors

Chaodong Xiao (1)

Papers (1)

Mar 10, 2026

Chaodong Xiao +16d ago

BinaryAttention: One-Bit QK-Attention for Vision and Diffusion Transformers

BinaryAttention proves you can more than halve the runtime of attention in vision and diffusion transformers without sacrificing accuracy, simply by using the sign of queries and keys.

Chaodong Xiao, Zhengqiang Zhang

Architecture Design (Transformers, SSMs, MoE)Computer Vision Inference & Quantization

Search

Zhengqiang Zhang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)