Wei Huang

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Reasoning & Chain-of-Thought (1)

Frequent co-authors

Weian Mao (1)Weian Mao (1)Xi Lin (1)Xi Lin (1)

Papers (1)

Apr 6, 2026

Weian Mao +131w ago

TriAttention: Efficient Long Reasoning with Trigonometric KV Compression

LLMs can achieve 2.5x higher throughput and 10.7x KV memory reduction in long-context reasoning by compressing the KV cache using trigonometric functions derived from pre-RoPE query/key vector distributions.

Weian Mao, Weian Mao, Xi Lin +11

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Reasoning & Chain-of-Thought

Search

Wei Huang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)