Lattice AI Research

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Distributed Systems & Hardware (1)Inference & Quantization (1)Training Efficiency & Optimization (1)

Frequent co-authors

M. Balandat (2)Igor Fedorov (1)Andrey Gromov (1)B. Beckerman (1)

Papers (2)

Mar 16, 2026

Meta AIMar 16, 2026·also Mila

MobileLLM-Flash: Latency-Guided On-Device LLM Design for Industry Scale

Forget exotic attention mechanisms – MobileLLM-Flash achieves up to 1.8x faster LLM prefill on mobile CPUs by smartly pruning and adapting existing architectures for on-device use.

Igor Fedorov, Andrey Gromov, B. Beckerman +12

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Feb 12, 2026

J. Lin +5Feb 12, 2026

Empirical Gaussian Processes

Forget handcrafted kernels: Empirical GPs learn flexible, data-driven priors directly from historical data, unlocking richer covariance structures.

J. Lin, S. Ament, Louis C. Tiao +3

Architecture Design (Transformers, SSMs, MoE)Training Efficiency & Optimization

Search

David Eriksson

Research focus

Frequent co-authors

Papers (2)