Jun Yu

Department of Automation, University of Science and Technology of China, Hefei, China

Papers on Lattice

Total citations

Topics

h-index

Research focus

Multimodal Models (2)Reasoning & Chain-of-Thought (1)Training Efficiency & Optimization (1)Computer Vision (1)

Frequent co-authors

Xilong Lu (1)Cong Wang (1)Qiang Ling (1)Fang Gao (1)

Papers (2)

Oct 27, 2025

Oct 27, 2025·also Huawei

LVLM-MIR: Large Vision-Language Model with Parameter-Efficient Fine-Tuning for Multimodal Interleaved Reasoning

Freezing most weights and only LoRA-tuning a vision-language model achieves near state-of-the-art multimodal interleaved reasoning performance, proving that targeted adaptation can rival full fine-tuning.

Jun Yu, Xilong Lu, Cong Wang +1

Multimodal Models Reasoning & Chain-of-Thought Training Efficiency & Optimization

Aug 29, 2025

Aug 29, 2025·also Guangxi China-Tek Blue Valley Semiconductor Technology Co.Ltd, Guangxi China-Tek Blue Valley Semiconductor Technology Company Ltd., USTC

Visual and Textual Commonsense-Enhanced Layout Learning for Vision-and-Language Navigation

VLN agents can navigate more effectively by learning commonsense relationships between rooms and landmarks, thanks to a new method that injects knowledge from ChatGPT, BLIP-2, and Stable Diffusion.

Fang Gao, Lei Shi, Jingfeng Tang +4

Computer Vision Multimodal Models Robotics & Embodied AI

Search

Jun Yu

Research focus

Frequent co-authors

Papers (2)