Xiaokun Sun

University of Science and Technology of China

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (2)Multimodal Models (2)Reasoning & Chain-of-Thought (1)

Frequent co-authors

Linli Xu (2)Zhou Tao (1)Fang Zhang (1)Zewen Ding (1)

Papers (2)

Jun 15, 2026

University of Science and Technology4d ago·also State Key Laboratory of Cognitive, USTC

LOCUS: Local Visual Cue Search for Enhancing Fine-Grained Perception in Multimodal Large Language Models

Training with local visual cues can dramatically enhance MLLMs' ability to extract fine-grained visual details without altering their inference interface.

Zhou Tao, Fang Zhang, Zewen Ding +5

Computer Vision Multimodal Models

Mar 17, 2026

Mar 17, 2026·also State Key Laboratory of Cognitive, University of Science and Technology

When Thinking Hurts: Mitigating Visual Forgetting in Video Reasoning via Frame Repetition

Video-LLMs can hallucinate and perform *worse* with chain-of-thought reasoning due to "visual anchor drifting," but a simple frame repetition strategy guided by a learned scoring function can fix it.

Xiaokun Sun, Haoyu Cao, Linli Xu

Computer Vision Multimodal Models Reasoning & Chain-of-Thought