Chengyue Wu

The University of Hong Kong

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (3)Multimodal Models (2)Robotics & Embodied AI (2)Natural Language Processing (1)

Frequent co-authors

Jin Wang (2)Enze Xie (2)Jing Xiong (1)Qi Han (1)

Papers (3)

Jun 9, 2026

1d ago·also LMSYS, UMich

Prefilling-dLLM: Predictive Prefilling for Long-Context Inference in Diffusion Language Models

Sparse prefilling can dramatically accelerate long-context inference in diffusion language models, achieving up to 28x speedup without sacrificing quality.

Jing Xiong, Qi Han, Shansan Gong +5

Inference & Quantization Natural Language Processing Scaling Laws & Emergent Abilities

May 22, 2026

Kewei Zhang +102w ago·also HKU, Soochow

Fast-dDrive: Efficient Block-Diffusion VLM for Autonomous Driving

By structuring diffusion-based driving models around a "scaffold" of frozen structural tokens, Fast-dDrive achieves a 12x speedup over autoregressive baselines while improving trajectory accuracy.

Kewei Zhang, Jin Wang, Sensen Gao +8

Inference & Quantization Multimodal Models Robotics & Embodied AI

Apr 8, 2026

Apr 8, 2026·also NVIDIA, MBZUAI, Soochow

Fast-dVLM: Efficient Block-Diffusion VLM via Direct Conversion from Autoregressive VLM

Swap out slow, one-token-at-a-time generation in VLMs for a 6x speed boost, without sacrificing quality, using a surprisingly simple direct conversion to block-diffusion decoding.

Chengyue Wu, Shiyi Lan, Yonggan Fu +6