Songlin Yang

The Hong Kong University of Science and Technology, V) setting. Figure 6: Fine-grained performance comparison of evaluated models in the Reference-to-Video (R

Papers on Lattice

Total citations

Topics

Research focus

Multimodal Models (2)Computer Vision (1)Eval Frameworks & Benchmarks (1)Interpretability & Mechanistic Interp (1)Reasoning & Chain-of-Thought (1)

Frequent co-authors

Haobin Zhong (1)Ruilin Zhang (1)Xiaotong Zhao (1)Xuyi Yang (1)

Papers (2)

May 22, 2026

May 22, 2026·also Stanford HAI, Tsinghua AI, Beijing Film Academy, CAS +4

EvalVerse: Pipeline-Aware and Expert-Calibrated Benchmarking for Professional Cinematic Video Generation

Current video generation benchmarks miss the forest for the trees: EvalVerse actually measures cinematic quality, not just prompt adherence.

Songlin Yang, Haobin Zhong, Ruilin Zhang +17

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Apr 13, 2026

Apr 13, 2026·also V) setting. Figure 6: Fine-grained

Pseudo-Unification: Entropy Probing Reveals Divergent Information Patterns in Unified Multimodal Models

Unified multimodal models aren't truly unified: vision and language modalities exhibit divergent entropy patterns during encoding and generation, hindering effective reasoning-based image synthesis.

Songlin Yang, Xianghao Kong, A. Rao

Interpretability & Mechanistic Interp Multimodal Models Reasoning & Chain-of-Thought

Search

Songlin Yang

Research focus

Frequent co-authors

Papers (2)