Shaocong Xu

Papers on Lattice

Total citations

Topics

h-index

Research focus

Computer Vision (2)Multimodal Models (2)Architecture Design (Transformers, SSMs, MoE) (1)Robotics & Embodied AI (1)

Frequent co-authors

Houyuan Chen (1)Hong Li (1)Xianghao Kong (1)Tianrui Zhu (1)

Papers (2)

May 1, 2026

Stanford HAIMay 1, 2026·also Tsinghua AI, Beihang, CUHK, HKUST +1

UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors

Instead of training separate video diffusion models for each multimodal task, UniVidX learns a single model that handles diverse pixel-aligned video generation problems.

Houyuan Chen, Hong Li, Xianghao Kong +8

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Mar 4, 2026

Mar 4, 2026·also NTU

ArtHOI: Articulated Human-Object Interaction Synthesis by 4D Reconstruction from Video Priors

Zero-shot synthesis of articulated human-object interactions is now possible by treating diffusion-generated videos as supervision for 4D scene reconstruction, unlocking physically grounded interactions beyond rigid manipulation.

Zihao Huang, Tianqi Liu, Zhaoxi Chen +8

Computer Vision Multimodal Models Robotics & Embodied AI

Search

Shaocong Xu

Research focus

Frequent co-authors

Papers (2)