May 11 – May 18, 2026

Multimodal Models - Weekly Roundup

5 papers published across 3 labs.

279% acceleration

Selected Labs publishing this week

DAMO1 CMU ML1 NUS1

Top Papers

May 14, 2026

Wuyang Li +62w ago

EverAnimate: Minute-Scale Human Animation via Latent Flow Restoration

Generate minute-long, high-fidelity animations without visual degradation or character drift using a surprisingly simple latent flow restoration technique.

Wuyang Li, Yang Gao, Mariam Hassan +4

Computer Vision Multimodal Models

May 18, 2026

1w ago·also SJTU, Tencent AI, UT Austin

OmniPro: A Comprehensive Benchmark for Omni-Proactive Streaming Video Understanding

Current video understanding models struggle with long-horizon robustness and non-speech audio, as revealed by the new OmniPro benchmark designed for comprehensive omni-modal proactive evaluation.

Ruixiang Zhao, Jie Yang, Zijie Xin +4

Computer Vision Eval Frameworks & Benchmarks Multimodal Models+1

DAMO1w ago

See What I Mean: Aligning Vision and Language Representations for Video Fine-grained Object Understanding

Multimodal LLMs struggle to pinpoint objects from nouns alone, but SWIM training realigns vision and language to outperform visual-prompt methods.

Computer Vision Multimodal Models Natural Language Processing

CMU ML1w ago

LatentUMM: Dual Latent Alignment for Unified Multimodal Models

UMMs struggle with cross-modal consistency not from a lack of shared representations, but from misaligned latent space transformations, which LatentUMM fixes.

Yinyi Luo, Wenwen Wang, Hayes Bai +2

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Training Efficiency & Optimization

May 17, 2026

NUS1w ago·also Oxford

Soap2Soap: Long Cinematic Video Remaking via Multi-Agent Collaboration

Achieve series-level cinematic remaking with Soap2Soap, a multi-agent framework that maintains narrative fidelity and character consistency across hundreds of shots, outperforming commercial video generation APIs.

Computer Vision Multimodal Models

Search

Multimodal Models - Weekly Roundup

Selected Labs publishing this week

Top Papers