Xiao-Wen Chang

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (2)Multimodal Models (1)Robotics & Embodied AI (1)Speech & Audio (1)

Frequent co-authors

Xinyu Wang (2)Mingze Li (1)Sicheng Lyu (1)Dongxiu Liu (1)

Papers (2)

May 27, 2026

Mila4d ago·also BUPT, McGill, SimpleWay.ai, SJTU

Ω-QVLA: Robust Quantization for Vision-Language-Action Models via Composite Rotation and Per-step Scaling

Uniformly quantizing the entire diffusion action head of VLAs to W4A4 is not only possible, but can match or exceed FP16 performance, defying conventional wisdom and slashing memory footprint by 71%.

Xinyu Wang, Mingze Li, Sicheng Lyu +5

Inference & Quantization Multimodal Models Robotics & Embodied AI

Xinyu Wang +64d ago

TARQ: Tail-Aware Reconstruction Quantization for Rare-Word Robust Automatic Speech Recognition

Quantizing ASR models can actually *improve* performance on rare words, without hurting overall accuracy, by strategically re-weighting the calibration data.

Xinyu Wang, Ziyu Zhao, K. Bai +4

Inference & Quantization Speech & Audio

Search

Xiao-Wen Chang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)