Lattice AI Research

Research focus

Training Efficiency & Optimization (2)Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Natural Language Processing (1)

Frequent co-authors

Mujin Kwun (2)Costin-Andrei Oncescu (1)Depen Morwani (1)Alexandru Meterez (1)

Papers (2)

Apr 23, 2026

Costin-Andrei Oncescu +51w ago

The Recurrent Transformer: Greater Effective Depth and Efficient Decoding

Recurrent Transformers let you trade model depth for width, slashing KV cache memory footprint and inference latency without sacrificing performance.

Costin-Andrei Oncescu, Depen Morwani, Samy Jelassi +3

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Mar 12, 2026

Microsoft ResearchMar 12, 2026

Matching Features, Not Tokens: Energy-Based Fine-Tuning of Language Models

Ditch the task-specific verifier: energy-based fine-tuning (EBFT) lets you directly optimize sequence-level behavior in LMs, beating SFT and matching RLVR in downstream tasks.

Samy Jelassi, Mujin Kwun, Rosie Zhao +4

Natural Language Processing Training Efficiency & Optimization

Search

Samy Jelassi

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)