Lattice AI Research

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Distributed Systems & Hardware (2)Inference & Quantization (1)Training Efficiency & Optimization (1)

Frequent co-authors

Ulf Schlichtmann (2)Chuangtao Chen (1)Xunzhao Yin (1)Cheng Zhuo (1)

Papers (2)

Apr 14, 2026

Chuangtao Chen +5Apr 14, 2026·also Jiangxi Arts & Ceramics Technology

KV Packet: Recomputation-Free Context-Independent KV Caching for LLMs

Achieve near-zero FLOPs and faster time-to-first-token by treating cached documents as immutable packets, eliminating the need for KV recomputation in LLMs.

Chuangtao Chen, Grace Li Zhang, Xunzhao Yin +3

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Mar 30, 2026

Sijie Fei +2Mar 30, 2026

OptINC: Optical In-Network-Computing for Scalable Distributed Learning

Training large models without communication overhead is now plausible: OptINC uses optical interconnects to perform gradient averaging and quantization directly in the network.

Sijie Fei, Grace Li Zhang, Ulf Schlichtmann

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

Search

Grace Li Zhang

Research focus

Frequent co-authors

Papers (2)