Lattice AI Research

Research focus

Distributed Systems & Hardware (1)Inference & Quantization (1)Architecture Design (Transformers, SSMs, MoE) (1)Code Generation & Program Synthesis (1)Training Efficiency & Optimization (1)

Frequent co-authors

Yixuan Mei (1)Zikun Li (1)Shiqi Pan (1)Xupeng Miao (1)

Papers (2)

May 5, 2026

Yixuan Mei +8May 5, 2026

Coral: Cost-Efficient Multi-LLM Serving over Heterogeneous Cloud GPUs

Save up to 2.79x on LLM serving costs by intelligently distributing models across a diverse fleet of cloud GPUs.

Yixuan Mei, Zikun Li, Shiqi Pan +6

Distributed Systems & Hardware Inference & Quantization

Apr 16, 2026

Mengdi Wu +2Apr 16, 2026·also Weizmann

Prism: Symbolic Superoptimization of Tensor Programs

Tensor program optimization just got a whole lot faster: Prism achieves up to 2.2x speedup over existing superoptimizers while *also* reducing end-to-end optimization time.

Mengdi Wu, Xiaoyu Jiang, Oded Padon

Architecture Design (Transformers, SSMs, MoE)Code Generation & Program Synthesis Training Efficiency & Optimization

Search

Mengdi Wu

Research focus

Frequent co-authors

Papers (2)