Kun He

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Computer Vision (2)Training Efficiency & Optimization (2)Multimodal Models (2)

Frequent co-authors

Zidan Wang (3)Shuoxi Zhang (3)HanZpeng Liu (2)Yaqian Li (2)

Papers (3)

Mar 4, 2026

Hanpeng Liu +41w ago

Separators in Enhancing Autoregressive Pretraining for Vision Mamba

Vision Mamba's ImageNet accuracy jumps to 83.5% thanks to a simple trick: adding separator tokens to enable pretraining on 4x longer sequences.

Hanpeng Liu, Zidan Wang, Shuoxi Zhang +2

Architecture Design (Transformers, SSMs, MoE)Computer Vision Training Efficiency & Optimization

Mar 3, 2026

HanZpeng Liu +71w ago

iGVLM: Dynamic Instruction-Guided Vision Encoding for Question-Aware Multimodal Understanding

Instruction-guided visual modulation with iGVLM unlocks more fine-grained reasoning in LVLMs, outperforming static vision encoders by dynamically adapting visual representations to the specific textual task.

HanZpeng Liu, Yaqian Li, Zidan Wang +5

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Reasoning & Chain-of-Thought

HanZpeng Liu +71w ago

ITO: Images and Texts as One via Synergizing Multiple Alignment and Training-Time Fusion

Image-text models can achieve superior performance by fusing modalities during training only, then discarding the fusion module at inference for efficiency.