Shengbang Tong

Papers on Lattice

Total citations

Topics

h-index

Research focus

Computer Vision (2)Multimodal Models (2)Architecture Design (Transformers, SSMs, MoE) (1)Natural Language Processing (1)

Frequent co-authors

David Fan (1)John Nguyen (1)Ellis Brown (1)Gaoyue Zhou (1)

Papers (2)

Mar 3, 2026

Meta AIMar 3, 2026·also NYU

Beyond Language Modeling: An Exploration of Multimodal Pretraining

Vision models are far more data-hungry than language models, but Mixture-of-Experts can harmonize this asymmetry for truly unified multimodal models.

Shengbang Tong, David Fan, John Nguyen +18

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Feb 26, 2026

Feb 26, 2026·also Meta AI

Asymmetric Idiosyncrasies in Multimodal Models

Text-to-image models wash away the unique stylistic fingerprints of their captioning counterparts, revealing a surprising disconnect between text and image generation.

Muzi Tao, Chufan Shi, Huijuan Wang +2

Computer Vision Multimodal Models Natural Language Processing

Search

Shengbang Tong

Research focus

Frequent co-authors

Papers (2)