Hezhen Hu

Papers on Lattice

Total citations

Topics

h-index

Research focus

Computer Vision (1)Multimodal Models (1)Robotics & Embodied AI (1)

Frequent co-authors

Zhiwen Fan (1)Jian Zhang (1)Renjie Li (1)Junge Zhang (1)

Papers (1)

May 26, 2025

Zhiwen Fan +16May 26, 2025

VLM-3R: Vision-Language Models Augmented with Instruction-Aligned 3D Reconstruction

Unlock human-like spatial reasoning in VLMs with VLM-3R, which reconstructs 3D understanding from monocular video using instruction tuning, bypassing the need for external depth sensors.

Zhiwen Fan, Jian Zhang, Renjie Li +1452

Computer Vision Multimodal Models Robotics & Embodied AI

Search

Hezhen Hu

Research focus

Frequent co-authors

Papers (1)