Xiaoshuai Sun

Papers on Lattice

Total citations

Topics

h-index

Research focus

Computer Vision (4)Multimodal Models (4)Architecture Design (Transformers, SSMs, MoE) (1)World Models & Planning (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Mingrui Wu (2)Chao Chang (1)Yiyi Zhou (1)Rongrong Ji (1)

Papers (4)

Mar 31, 2026

Chao Chang +3Mar 31, 2026

Scaling the Long Video Understanding of Multimodal Large Language Models via Visual Memory Mechanism

Forget expensive training: FlexMem unlocks SOTA long-video MLLM performance on a single GPU by cleverly mimicking human memory recall.

Chao Chang, Xiaoshuai Sun, Yiyi Zhou +1

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Mar 17, 2026

Qiyun Wang +5Mar 17, 2026·also Netease Inc, ZJU

Persistent Story World Simulation with Continuous Character Customization

Forget finetuning a new LoRA for every character: EverTale introduces a single LoRA that adapts to *all* characters in a story, enabling continuous character customization with improved fidelity and efficiency.

Qiyun Wang, Baoxiang Du, Jing He +3

Computer Vision Multimodal Models World Models & Planning

Feb 23, 2026

Xiamen UniversityFeb 23, 2026·also Zhongguancun Academy

MICON-Bench: Benchmarking and Enhancing Multi-Image Context Image Generation in Unified Multimodal Models

Existing multimodal models struggle with multi-image reasoning, but a new benchmark and inference-time attention fix exposes and alleviates these shortcomings.

Mingrui Wu, Hang Liu, Xiaoshuai Sun

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Xiamen UniversityFeb 23, 2026·also Zhongguancun Academy

Test-Time Computing for Referring Multimodal Large Language Models

Steer frozen MLLMs to reason about specific image regions at test time, without any training, by optimizing visual prompts that guide cross-modal attention.

Mingrui Wu, Xiaoshuai Sun

Computer Vision Inference & Quantization Multimodal Models

Search

Xiaoshuai Sun

Research focus

Frequent co-authors

Papers (4)