Yu Xiao

Aalto University

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (1)Eval Frameworks & Benchmarks (1)Multimodal Models (1)

Frequent co-authors

Zhu Liu (1)Zhuchenyang Liu (1)Yao Zhang (1)

Papers (1)

Apr 1, 2026

3w ago

Benchmarking and Mechanistic Analysis of Vision-Language Models for Cross-Depiction Assembly Instruction Alignment

VLMs struggle to align assembly diagrams and videos because they occupy disjoint visual representation spaces, revealing a fundamental limitation in cross-modal understanding.

Zhu Liu, Zhuchenyang Liu, Yao Zhang +1

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Search

Yu Xiao

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)