Spyros Gidaris

Papers on Lattice

Total citations

Topics

h-index

Research focus

Computer Vision (5)Multimodal Models (3)Training Efficiency & Optimization (2)World Models & Planning (2)Open-Source Models & Weights (1)

Frequent co-authors

Shashanka Venkataramanan (2)Elias Ramzi (2)Andrei Bursuc (2)Theodoros Kouzelis (1)

Papers (5)

Apr 19, 2026

Theodoros Kouzelis +2Apr 19, 2026

Coevolving Representations in Joint Image-Feature Diffusion

Image diffusion models get a boost by letting their semantic feature space evolve during training, leading to faster convergence and better image quality.

Theodoros Kouzelis, Spyros Gidaris, Nikos Komodakis

Computer Vision Multimodal Models Training Efficiency & Optimization

Apr 14, 2026

Sophia Sirko-Galouchenko +4Apr 14, 2026

Boosting Visual Instruction Tuning with Self-Supervised Guidance

MLLMs can get a surprising visual reasoning boost from a simple trick: adding just a dash of visually grounded self-supervision to instruction tuning.

Sophia Sirko-Galouchenko, Monika Wysoczanska, Andrei Bursuc +2

Computer Vision Multimodal Models Training Efficiency & Optimization

Apr 13, 2026

Apr 13, 2026·also NTUA, University of Crete

Representations Before Pixels: Semantics-Guided Hierarchical Video Prediction

By predicting future scene structure in the feature space of a frozen vision foundation model before rendering pixels, Re2Pix achieves state-of-the-art video prediction with improved temporal consistency and perceptual quality.

Efstathios Karypidis, Spyros Gidaris, Nikos Komodakis

Computer Vision World Models & Planning

Jul 18, 2025

Franca: Nested Matryoshka Clustering for Scalable Visual Representation Learning

Franca leapfrogs proprietary vision models like DINOv2 and CLIP, proving open-source can win on performance and transparency in visual representation learning.

Shashanka Venkataramanan, Valentinos Pariza, Mohammadreza Salehi +58

Computer Vision Multimodal Models Open-Source Models & Weights

Feb 21, 2025

Feb 21, 2025·also DreamSim FLUX

VaViM and VaVAM: Autonomous Driving through Video Generative Modeling

Video pre-training can drive autonomous vehicles, but scaling model size doesn't always guarantee safer closed-loop driving.

Florent Bartoccioni, Elias Ramzi, Victor Besnier +1413

Computer Vision Robotics & Embodied AI World Models & Planning

Search

Spyros Gidaris

Research focus

Frequent co-authors

Papers (5)