Tao Lin

Generative training not only enhances a model's ability to manipulate objects in images, but also surprisingly strengthens its spatial reasoning skills.

Muzhi Zhu, Shunyao Jiang, Huan Zheng +11

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Apr 22, 2026·also AGI Research Center, Imperial, Inclusion AI, Westlake

LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language Model

A single model now rivals specialized vision-language models in understanding, while also generating and editing images, thanks to a unified discrete diffusion framework.

A. Inclusion, Inclusion AI, Tiwei Bie +22

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Search

Tao Lin

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)