Chaodong Xiao

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Computer Vision (1)Inference & Quantization (1)Distributed Systems & Hardware (1)

Frequent co-authors

Zhengqiang Zhang (1)Jinrui Zhang (1)Aoqi Wu (1)Xindong Zhang (1)

Papers (2)

Mar 10, 2026

Chaodong Xiao +16d ago

BinaryAttention: One-Bit QK-Attention for Vision and Diffusion Transformers

BinaryAttention proves you can more than halve the runtime of attention in vision and diffusion transformers without sacrificing accuracy, simply by using the sign of queries and keys.

Chaodong Xiao, Zhengqiang Zhang

Architecture Design (Transformers, SSMs, MoE)Computer Vision Inference & Quantization

Feb 12, 2026

Feb 12, 2026·also PolyU

Pretraining A Large Language Model using Distributed GPUs: A Memory-Efficient Decentralized Paradigm

Train a competitive 2B MoE LLM on 16 commodity GPUs connected via the internet, proving you don't need a datacenter to play the LLM game.

Jinrui Zhang, Chaodong Xiao, Aoqi Wu +2

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

Search

Chaodong Xiao

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)