Xiaopeng Sun

Papers on Lattice

Total citations

Topics

h-index

Research focus

Multimodal Models (2)Eval Frameworks & Benchmarks (1)Reasoning & Chain-of-Thought (1)Computer Vision (1)Speech & Audio (1)

Frequent co-authors

Haonan Han (1)Jiancheng Huang (1)Junyan He (1)Rui Yang (1)

Papers (2)

Mar 26, 2026

Haonan Han +9Mar 26, 2026

ViGoR-Bench: How Far Are Visual Generative Models From Zero-Shot Visual Reasoners?

Despite impressive visual fidelity, today's generative models still stumble on basic physical, causal, and spatial reasoning tasks, revealing a "logical desert" beneath the surface.

Haonan Han, Jiancheng Huang, Xiaopeng Sun +7

Eval Frameworks & Benchmarks Multimodal Models Reasoning & Chain-of-Thought

Feb 25, 2026

Feb 25, 2026·also Donghua University, ECNU, IBM Research, University of Louisiana at Lafayette

SkyReels-V4: Multi-modal Video-Audio Generation, Inpainting and Editing model

Finally, a single model handles multi-modal video generation, inpainting, and editing at cinematic resolutions with synchronized audio, all while accepting diverse inputs like text, images, video clips, and audio references.

Guibin Chen, Guibin Chen, Dixuan Lin +73

Computer Vision Multimodal Models Speech & Audio

Search

Xiaopeng Sun

Research focus

Frequent co-authors

Papers (2)