Shaofeng Zhang

Papers on Lattice

Total citations

Topics

h-index

Research focus

Computer Vision (4)Multimodal Models (3)Architecture Design (Transformers, SSMs, MoE) (2)Eval Frameworks & Benchmarks (1)World Models & Planning (1)

Frequent co-authors

Ning Liao (2)Xiangyu Zhao (2)Junchi Yan (2)Qi Tang (1)

Papers (4)

Mar 18, 2026

Qi Tang +6Mar 18, 2026

Prompt-Free Universal Region Proposal Network

Forget prompt engineering: this new region proposal network spots objects across diverse datasets without *any* text or image prompts.

Qi Tang, Qihong Tang, Changhan Liu +4

Architecture Design (Transformers, SSMs, MoE)Computer Vision

Mar 12, 2026

Soyeon Caren Han is the correspondingMar 12, 2026

EvoTok: A Unified Image Tokenizer via Residual Latent Evolution for Visual Understanding and Generation

Forget billion-scale datasets: EvoTok achieves state-of-the-art image tokenization for both understanding and generation using a residual evolution process trained on just 13M images.

Yan Li, Ning Liao, Xiangyu Zhao +4

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Mingxin Liu +15Mar 12, 2026

GRADE: Benchmarking Discipline-Informed Reasoning in Image Editing

Current image editing models stumble when domain-specific knowledge is required, as revealed by a new benchmark spanning disciplines from natural science to social science.

Mingxin Liu, Ziqian Fan, Zhaokai Wang +13

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Feb 28, 2026

DreamWorld: Unified World Modeling in Video Generation

DreamWorld achieves more world-consistent video generation by jointly modeling multiple heterogeneous dimensions of world knowledge, moving beyond surface-level plausibility.

Bo Tan, Xiang Zhang, Ning Liao +5

Computer Vision Multimodal Models World Models & Planning

Search

Shaofeng Zhang

Research focus

Frequent co-authors

Papers (4)