Yezhou Yang

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (3)Multimodal Models (2)Architecture Design (Transformers, SSMs, MoE) (1)Robotics & Embodied AI (1)

Frequent co-authors

Prithvi Jai Ramesh (2)Krishna Vinod (2)Joseph Raj Vishal (2)Bharatesh Chakravarthi (2)

Papers (3)

Apr 27, 2026

Maitreya Patel +4Apr 27, 2026

VibeToken: Scaling 1D Image Tokenizers and Autoregressive Models for Dynamic Resolution Generations

Autoregressive image models can now compete with diffusion models in image quality and efficiency, thanks to a variable-length tokenization scheme that decouples compute from resolution.

Maitreya Patel, Jingtao Li, Weiming Zhuang +2

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Mar 15, 2026

eNavi: Event-based Imitation Policies for Low-Light Indoor Mobile Robot Navigation

Event cameras can rescue robot navigation in low-light environments where RGB fails, as demonstrated by a new multimodal policy that leverages event data for robust imitation learning.

Prithvi Jai Ramesh, Kaustav Chanda, Krishna Vinod +3

Computer Vision Robotics & Embodied AI

Feb 24, 2026

Joseph Raj Vishal +9Feb 24, 2026

UDVideoQA: A Traffic Video Question Answering Dataset for Multi-Object Spatio-Temporal Reasoning in Urban Dynamics

Despite excelling at abstract inference, today's best video language models still struggle with basic visual grounding in real-world urban traffic scenarios, highlighting a critical perception-reasoning gap.

Joseph Raj Vishal, Nagasiri Poluri, Katha Naik +7

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Search

Yezhou Yang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)