Bei Li

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (1)Reasoning & Chain-of-Thought (1)Training Efficiency & Optimization (1)

Frequent co-authors

Xinyu Liu (1)Xin Liu (1)Bo Jin (1)Runsong Zhao (1)

Papers (1)

Apr 16, 2026

Xinyu Liu +91w ago

MemoSight: Unifying Context Compression and Multi Token Prediction for Reasoning Acceleration

Reasoning with LLMs just got a whole lot faster: MemoSight cuts KV cache footprint by 66% and speeds up inference by 1.56x without sacrificing CoT performance.

Xinyu Liu, Xin Liu, Bo Jin +7

Inference & Quantization Reasoning & Chain-of-Thought Training Efficiency & Optimization

Search

Bei Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)