Zhouhan Lin

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (4)Training Efficiency & Optimization (4)Inference & Quantization (3)Natural Language Processing (1)

Frequent co-authors

Ziwei He (4)Shixiang Song (2)He Li (2)Boyi Zeng (2)

Papers (4)

Mar 17, 2026

VQKV: High-Fidelity and High-Ratio Cache Compression via Vector-Quantization

Squeeze your LLM's KV cache by 82% without significant performance loss using VQKV's novel vector quantization approach.

Qingyu Shi, Jiayu Zhou, Dianbo Liu +2

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Mar 3, 2026

Junzhe Shen +2Mar 3, 2026

CoDAR: Continuous Diffusion Language Models are More Powerful Than You Think

Continuous diffusion LMs can rival discrete models by fixing the token-rounding bottleneck with a contextual autoregressive decoder, unlocking a fluency-diversity knob in the process.

Junzhe Shen, Ziwei He, Zhouhan Lin

Architecture Design (Transformers, SSMs, MoE)Natural Language Processing Training Efficiency & Optimization

Mar 2, 2026

Shixiang Song +12Mar 2, 2026

AdaPonderLM: Gated Pondering Language Models with Token-Wise Adaptive Depth

Key contribution not extracted.

Shixiang Song, He Li, Zitong Wang +10

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

He Li +11Mar 2, 2026

PonderLM-3: Adaptive Token-Wise Pondering with Differentiable Masking

Stop wasting compute: PonderLM-3 learns to spend extra inference FLOPs only on the tokens that actually need them, outperforming fixed-step pondering methods.

He Li, Fei Song, Feichen Song +9

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Zhouhan Lin

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (4)