Chenyang Zhou

Columbia University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Inference & Quantization (1)Data Curation & Synthetic Data (1)

Frequent co-authors

Zhongkai Yu (1)Haotian Ye (1)Haotian Ye (1)O. Venkatachalam (1)

Papers (2)

Apr 28, 2026

3d ago·also NVIDIA, Columbia, Samsung Semiconductor, Yonsei

AMMA: A Multi-Chiplet Memory-Centric Architecture for Low-Latency 1M Context Attention Serving

Forget GPU-centric designs: AMMA slashes attention latency by 15x and energy consumption by 7x with a memory-centric architecture for long-context LLMs.

Zhongkai Yu, Haotian Ye, Haotian Ye +12

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Feb 8, 2026

Yiwei Qin +7Feb 8, 2026·also Columbia, Manuscript received February 24

Data Darwinism Part I: Unlocking the Value of Scientific Data for Pre-training

Frontier LLMs can unlock substantial performance gains in scientific domains by refining and completing raw scientific text, leading to a +8.40 point improvement on domain-aligned tasks.

Yiwei Qin, Zhen Huang, Tiantian Mi +5

Data Curation & Synthetic Data Natural Language Processing Scientific Discovery & Drug Design

Search

Chenyang Zhou

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)