Hayden Kwok-Hay So

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (2)Inference & Quantization (2)Training Efficiency & Optimization (2)Architecture Design (Transformers, SSMs, MoE) (1)

Frequent co-authors

Xiaomeng Fu (2)Jia Li (1)Yiming Hu (1)Yong Wang (1)

Papers (3)

Jul 1, 2026

DAMO3w ago·also Beihang, CAS, HKU

Towards Memory-Efficient Autoregressive Video Generation via Instance-Specific Parametric Absorption

Memory overload in autoregressive video generation can be tackled by absorbing historical context into model weights, achieving up to 50% cache reduction with minimal quality loss.

Xiaomeng Fu, Jia Li, Yiming Hu +4

Computer Vision Inference & Quantization

Mar 18, 2026

Mar 18, 2026·also Tsinghua AI, HKU, LongCat Team, PKU +1

Beyond Outliers: A Data-Free Layer-wise Mixed-Precision Quantization Approach Driven by Numerical and Structural Dual-Sensitivity

Achieve better compression in low-bit quantization by considering not just numerical sensitivity, but also the structural role of each layer.

Hengyuan Zhang, Xinrong Chen, Zunhai Su +5

Inference & Quantization Training Efficiency & Optimization

Feb 15, 2026

Feb 15, 2026·also HKU

Train Short, Inference Long: Training-free Horizon Extension for Autoregressive Video Generation

Autoregressive video models can now generate 4-minute videos without retraining, thanks to a clever inference-time hack that fixes positional embedding bias and injects dynamic priors.

Xiaomeng Fu, Xurui Peng, Youwei Zheng +5

Architecture Design (Transformers, SSMs, MoE)Computer Vision Training Efficiency & Optimization

Search

Hayden Kwok-Hay So

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)