Songqun Gao

Papers on Lattice

Total citations

Topics

Research focus

Computer Vision (1)Multimodal Models (1)Recommendation & Information Retrieval (1)

Frequent co-authors

Zanxi Ruan (1)Qiuyu Kong (1)Marco Cristani (1)

Papers (1)

Feb 23, 2026

University of VeronaFeb 23, 2026·also Sapienza

StructXLIP: Enhancing Vision-language Models with Multimodal Structural Cues

By focusing on structural cues, StructXLIP significantly boosts vision-language alignment, outperforming existing methods in cross-modal retrieval tasks.

Zanxi Ruan, Qiuyu Kong, Songqun Gao +1

Computer Vision Multimodal Models Recommendation & Information Retrieval

Search

Songqun Gao

Research focus

Frequent co-authors

Papers (1)