Jiangning Zhang

Zhejiang University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (3)Computer Vision (2)Data Curation & Synthetic Data (1)Speech & Audio (1)

Frequent co-authors

Yuheng Chen (2)Teng Hu (2)Yuji Wang (2)Qingdong He (2)

Papers (3)

Jun 8, 2026

1w ago·also NTU, UESTC, UTokyo, ZJU

CineDance: Towards Next-Generation Multi-Shot Long-Form Cinematic Audio-Video Generation

CineDance-1M sets a new standard for open-source cinematic audio-video generation, boasting over 1 million high-quality, structured video samples that could transform the landscape of multimedia AI.

Yuheng Chen, Teng Hu, Yuji Wang +7

Data Curation & Synthetic Data Multimodal Models Speech & Audio

Jun 5, 2026

Jiahao Meng +101w ago·also UTokyo, ZJU

Watch, Remember, Reason: Human-View Video Understanding with MLLMs

MLLMs can revolutionize video understanding by integrating watching, remembering, and reasoning into a cohesive framework that addresses long-range dependencies and sparse evidence.

Jiahao Meng, Kuan Gao, Weisong Liu +8

Computer Vision Multimodal Models

Jun 1, 2026

2w ago·also UESTC, ZJU

Spatial-Temporal Decoupled Reference Conditioning for Identity-Preserving Text-to-Video Generation

Achieving top-tier identity preservation in text-to-video generation without compromising on semantic fidelity, ST-DRC redefines the standards for high-quality video synthesis.

Yuheng Chen, Teng Hu, Yuji Wang +3