Jiaxin Fan

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (2)Computer Vision (1)Tool Use & Agents (1)Architecture Design (Transformers, SSMs, MoE) (1)

Frequent co-authors

V Team (1)Wenyi Hong (1)Xiaotao Gu (1)Ziyang Pan (1)

Papers (2)

Apr 29, 2026

Tsinghua AI2d ago·also CAS, China Telecom Research Institute, Fudan, HKUST +3

GLM-5V-Turbo: Toward a Native Foundation Model for Multimodal Agents

Multimodal agents can now reason, plan, and execute actions more effectively by integrating perception as a core component, not just an auxiliary interface.

V Team, Wenyi Hong, Xiaotao Gu +75

Computer Vision Multimodal Models Tool Use & Agents

Mar 5, 2026

Jiaxin Fan +1Mar 5, 2026

VisionPangu: A Compact and Fine-Grained Multimodal Assistant with 1.7B Parameters

A 1.7B-parameter model can rival larger LMMs in detailed image captioning, proving that high-quality supervision and efficient architecture are more crucial than brute-force scaling.

Jiaxin Fan, Wenpo Song

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Training Efficiency & Optimization

Search

Jiaxin Fan

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)