Zhihang Zhong

Papers on Lattice

Total citations

Topics

h-index

Research focus

Multimodal Models (3)Computer Vision (2)Eval Frameworks & Benchmarks (2)Architecture Design (Transformers, SSMs, MoE) (1)Open-Source Models & Weights (1)

Frequent co-authors

Mingxin Liu (2)Ziqian Fan (2)Zhaokai Wang (2)Leyao Gu (2)

Papers (3)

Mar 12, 2026

Mingxin Liu +15Mar 12, 2026

GRADE: Benchmarking Discipline-Informed Reasoning in Image Editing

Current image editing models stumble when domain-specific knowledge is required, as revealed by a new benchmark spanning disciplines from natural science to social science.

Mingxin Liu, Ziqian Fan, Zhaokai Wang +13

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Mar 10, 2026

Mar 10, 2026·also AGI Research Center, AI Laboratory, BUPT, CUHK +6

InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing

A 4B-parameter model, InternVL-U, outperforms 14B-parameter models in multimodal generation and editing, proving that size isn't everything.

Changyao Tian, Danni Yang, Guanzhou Chen +27

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Open-Source Models & Weights

Mar 10, 2026

Stepping VLMs onto the Court: Benchmarking Spatial Intelligence in Sports

Sports expose surprising limitations in VLMs' spatial reasoning, as current models struggle to generalize from existing benchmarks despite fine-tuning gains on a new, large-scale dataset.

Yuchen Yang, Yuqing Shao, Duxiu Huang +12

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Search

Zhihang Zhong

Research focus

Frequent co-authors

Papers (3)