Digant Desai

Papers on Lattice

Total citations

Topics

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Inference & Quantization (1)Scaling Laws & Emergent Abilities (1)

Frequent co-authors

Yanbei Chen (1)Hanxian Huang (1)Ernie Chang (1)Jacob Szwejbka (1)

Papers (1)

May 26, 2026

Yanbei Chen +6May 26, 2026

MobileMoE: Scaling On-Device Mixture of Experts

On-device LLMs can achieve state-of-the-art performance with significantly reduced computational cost by leveraging a carefully designed Mixture-of-Experts architecture, challenging the assumption that dense models are always superior for mobile deployment.

Yanbei Chen, Hanxian Huang, Ernie Chang +4

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Scaling Laws & Emergent Abilities

Search

Digant Desai

Research focus

Frequent co-authors

Papers (1)