Yukun Zhang

Beijing Institute of Technology, Beijing, China

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (2)Architecture Design (Transformers, SSMs, MoE) (1)Computer Vision (1)Interpretability & Mechanistic Interp (1)

Frequent co-authors

Tao Xia (1)Ting Liu (1)Wei Wang (1)Hongxuan Wu (1)

Papers (2)

Mar 30, 2026

Mar 30, 2026·also CAS

Rethinking Structure Preservation in Text-Guided Image Editing with Visual Autoregressive Models

Achieve significantly better structure preservation in text-guided image editing by injecting structure-related features into visual autoregressive models, guided by reinforcement learning.

Tao Xia, Yukun Zhang, Ting Liu +1

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Feb 17, 2026

Feb 17, 2026·also BIT, Fudan, HKU

How Vision Becomes Language: A Layer-wise Information-Theoretic Analysis of Multimodal Reasoning

Multimodal LLMs primarily rely on language-unique information for final predictions, with visual information decaying across layers and cross-modal synergy remaining surprisingly low (under 2%).

Hongxuan Wu, Yukun Zhang, Xueqing Zhou

Interpretability & Mechanistic Interp Multimodal Models Reasoning & Chain-of-Thought

Search

Yukun Zhang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)