Lattice AI Research

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Inference & Quantization (2)Scientific Discovery & Drug Design (1)Training Efficiency & Optimization (1)

Frequent co-authors

Giovanni Charles (1)Seth Flaxman (1)Elizaveta Semenova (1)C. Santoni (1)

Papers (3)

Apr 22, 2026

Apr 22, 2026·also Oxford

Tokenised Flow Matching for Hierarchical Simulation Based Inference

Unlock 10x faster simulation-based inference in hierarchical models by training on single-site simulations and assembling synthetic multi-site data.

Giovanni Charles, Cosmo Santoni, Seth Flaxman +1

Scientific Discovery & Drug Design Training Efficiency & Optimization

Mar 10, 2026

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Mamba-2's efficiency doesn't require custom CUDA kernels: XLA's compiler optimizations are enough to unlock near-optimal performance across diverse hardware.

C. Santoni, Cosmo Santoni

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Open-Source Models & Weights

Feb 25, 2026

Contextual Memory Virtualisation: DAG-Based State Management and Structurally Lossless Trimming for LLM Agents

LLMs can retain more context and history without blowing your token budget using a DAG-based memory system and lossless trimming that cuts context length by up to 86%.

Cosmo Santoni

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Tool Use & Agents

Search

Cosmo Santoni

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)