Xuanyao Fong

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Inference & Quantization (1)

Frequent co-authors

Jintao Zhang (1)

Papers (1)

Apr 8, 2026

NUS1w ago

SHIELD: A Segmented Hierarchical Memory Architecture for Energy-Efficient LLM Inference on Edge NPUs

You can slash LLM inference energy by 35% on edge devices just by intelligently managing eDRAM refresh rates based on activation data type and lifespan.

Jintao Zhang, Xuanyao Fong

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Search

Xuanyao Fong

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)