Tingwei Lu

Papers on Lattice

Total citations

Topics

Research focus

Inference & Quantization (1)Natural Language Processing (1)

Frequent co-authors

Shunlong Wu (1)Hai Lin (1)Shaoshen Chen (1)Yongqin Zeng (1)

Papers (1)

Mar 15, 2026

Shunlong Wu +6Mar 15, 2026

SemantiCache: Efficient KV Cache Compression via Semantic Chunking and Clustered Merging

SemantiCache achieves up to 2.61x faster decoding and reduces memory footprint without sacrificing model performance by compressing KV caches along semantic boundaries.

Shunlong Wu, Hai Lin, Shaoshen Chen +4

Inference & Quantization Natural Language Processing

Search

Tingwei Lu

Research focus

Frequent co-authors

Papers (1)