Lei Zhang

SKLP, Institute of Computing Technology, Chinese Academy of Sciences, Hong Kong Polytechnic University

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Inference & Quantization (1)

Frequent co-authors

Yiqi Liu (1)Yudong Pan (1)Mengdi Wang (1)Shixin Zhao (1)

Papers (1)

Mar 3, 2026

1w ago·also Georgia Tech, PolyU

Ouroboros: Wafer-Scale SRAM CIM with Token-Grained Pipelining for Large Language Model Inference

Wafer-scale SRAM CIM can deliver up to 17x better energy efficiency for LLM inference by eliminating off-chip data movement and using token-grained pipelining.

Yiqi Liu, Yudong Pan, Mengdi Wang +6

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Search

Lei Zhang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)