An Zou

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Scaling Laws & Emergent Abilities (1)

Frequent co-authors

Ying-Chi Shen (1)Yingtao Shen (1)

Papers (1)

Apr 20, 2026

Ying-Chi Shen +2Apr 20, 2026·also SJTU

River-LLM: Large Language Model Seamless Exit Based on KV Share

LLMs can achieve up to 2x inference speedup without retraining by intelligently sharing KV cache states during early exit, sidestepping the usual performance bottlenecks.

Ying-Chi Shen, Yingtao Shen, An Zou

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Scaling Laws & Emergent Abilities

Search

An Zou

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)