O. Venkatachalam

University of California, San Diego

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Inference & Quantization (1)Reasoning & Chain-of-Thought (1)

Frequent co-authors

Zhongkai Yu (1)Haotian Ye (1)Haotian Ye (1)Chenyang Zhou (1)

Papers (2)

Apr 28, 2026

3d ago·also NVIDIA, Columbia, Samsung Semiconductor, Yonsei

AMMA: A Multi-Chiplet Memory-Centric Architecture for Low-Latency 1M Context Attention Serving

Forget GPU-centric designs: AMMA slashes attention latency by 15x and energy consumption by 7x with a memory-centric architecture for long-context LLMs.

Zhongkai Yu, Haotian Ye, Haotian Ye +12

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Feb 12, 2026

Jianwei Yang +3Feb 12, 2026·also UCSD

Think like a Scientist: Physics-guided LLM Agent for Equation Discovery

LLMs can discover equations with significantly higher accuracy and robustness by explicitly modeling the multi-step reasoning process scientists use, rather than guessing directly from data.

Jianwei Yang, O. Venkatachalam, Mohammad Kianezhad +1

Reasoning & Chain-of-Thought Scientific Discovery & Drug Design Tool Use & Agents

Search

O. Venkatachalam

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)