Yufei Cui

McGill University, Mila – Quebec AI Institute

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (2)Multimodal Models (1)Robotics & Embodied AI (1)Architecture Design (Transformers, SSMs, MoE) (1)

Frequent co-authors

Xinyu Wang (1)Mingze Li (1)Sicheng Lyu (1)Dongxiu Liu (1)

Papers (2)

May 27, 2026

Mila4d ago·also BUPT, McGill, SimpleWay.ai, SJTU

Ω-QVLA: Robust Quantization for Vision-Language-Action Models via Composite Rotation and Per-step Scaling

Uniformly quantizing the entire diffusion action head of VLAs to W4A4 is not only possible, but can match or exceed FP16 performance, defying conventional wisdom and slashing memory footprint by 71%.

Xinyu Wang, Mingze Li, Sicheng Lyu +5

Inference & Quantization Multimodal Models Robotics & Embodied AI

Apr 7, 2026

Abbas Ghaddar +3Apr 7, 2026·also Mila, McGill

BOSCH: Black-Box Binary Optimization for Short-Context Attention-Head Selection in LLMs

Static rankings of attention heads for local/global behavior become unreliable after hybridizing attention mechanisms in LLMs, necessitating adaptive selection methods like BOSCH.

Abbas Ghaddar, Ivan Kobyzev, Boxing Chen +1

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Yufei Cui

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)