Hangyu Cao

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (2)Multimodal Models (2)Robotics & Embodied AI (2)

Frequent co-authors

Hailong Zou (2)Zihao Zheng (1)Sicheng Tian (1)Chenyue Li (1)

Papers (2)

Mar 9, 2026

Hangyu Cao +1Mar 9, 2026

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

Squeeze your embodied AI models: DyQ-VLA cuts memory footprint by 70% and speeds up inference by 40% without sacrificing performance, all by dynamically adjusting bit-widths based on real-time kinematic data.

Hangyu Cao, Hailong Zou

Inference & Quantization Multimodal Models Robotics & Embodied AI

Mar 9, 2026·also Corresponding Author

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

VLA models get a 1.73x speedup with only 5-7% overhead thanks to RAPID, a new edge-cloud collaborative inference framework that smartly handles visual noise and motion continuity.

Zihao Zheng, Sicheng Tian, Hangyu Cao +9