Qi Han

The University of Hong Kong

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (2)Natural Language Processing (1)Scaling Laws & Emergent Abilities (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Yunta Hsieh (2)Shansan Gong (1)Chenyang Zhao (1)Ngai Wong (1)

Papers (2)

Jun 9, 2026

Jun 9, 2026·also Hong Kong University of Science & Technology, LMSYS, UMich

Prefilling-dLLM: Predictive Prefilling for Long-Context Inference in Diffusion Language Models

Sparse prefilling can dramatically accelerate long-context inference in diffusion language models, achieving up to 28x speedup without sacrificing quality.

Qi Han, Shansan Gong, Yunta Hsieh +2

Inference & Quantization Natural Language Processing Scaling Laws & Emergent Abilities

Mar 16, 2026

Mar 16, 2026·also B. Topic Samples Data source(s), HKU, Ohio State, PKU

MMSpec: Benchmarking Speculative Decoding for Vision-Language Models

Text-based speculative decoding falls flat for vision-language models, but ViSkip dynamically adapts to vision tokens for state-of-the-art acceleration.

Yunta Hsieh, Qi Han, Zhongwei Wan +3

Eval Frameworks & Benchmarks Inference & Quantization Multimodal Models

Search

Qi Han

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)