Russ Webb

Apple, Berkeley University

Apple ML Research

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (1)Scaling Laws & Emergent Abilities (1)Speech & Audio (1)

Frequent co-authors

Louis Bethune (1)L. Béthune (1)Victor Turrisi (1)V. Turrisi (1)

Papers (1)

Feb 25, 2026

Apple ML2w ago·also Berkeley University, Institut National de la Recherche

The Design Space of Tri-Modal Masked Diffusion Models

Tri-modal masked diffusion models can now be trained from scratch, achieving strong results in text generation, text-to-image, and text-to-speech, thanks to a systematic exploration of the design space and a novel SDE-based batch size reparameterization.

Louis Bethune, L. Béthune, Victor Turrisi +45

Multimodal Models Scaling Laws & Emergent Abilities Speech & Audio

Search

Russ Webb

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)