Ngai Wong

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Multimodal Models (1)

Frequent co-authors

Zunhai Su (1)Weihao Ye (1)Hansen Feng (1)Keyu Fan (1)

Papers (1)

Jan 3, 2026

Zunhai Su +7Jan 3, 2026

XStreamVGGT: Extremely Memory-Efficient Streaming Vision Geometry Grounded Transformer with KV Cache Compression

Squeeze 3D vision transformers: XStreamVGGT slashes memory consumption by 4.42x and accelerates inference by 5.48x via pruning and quantization of the KV cache, all with negligible performance loss.

Zunhai Su, Weihao Ye, Hansen Feng +5

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Multimodal Models

Search

Ngai Wong

Research focus

Frequent co-authors

Papers (1)