Weidi Xie

Shanghai Jiao Tong University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (4)Multimodal Models (3)Reasoning & Chain-of-Thought (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Yanfeng Wang (3)Pengcheng Qiu (2)Ya Zhang (2)Yu Zhang (1)

Papers (5)

Jul 23, 2026

3d ago

BasketEvent: Understanding Who Did What and When in Basketball Videos

Player-centric modeling in basketball video analysis reveals that traditional methods miss critical interactions, leading to significant performance improvements with the new PlayNet framework.

Yu Zhang, Jiayuan Rao, Haoning Wu +1

Computer Vision Multimodal Models

Jul 8, 2026

NUS2w ago·also Aalborg, Chung-Ang, CVC, HFUT +19

SoccerNet 2026 Challenges Results

Over 1,100 submissions reveal groundbreaking advancements in sports video understanding, with new methods pushing the boundaries of action prediction and localization.

Anthony Cioppa, Silvio Giancola, Håkan Ardö +90

Computer Vision Multimodal Models

Jun 4, 2026

University of Science and TechnologyJun 4, 2026·also Artificial Intelligence Laboratory, Harvard, SJTU, WHU

A Vision-language Framework for Comparative Reasoning in Radiology

Entity-aware comparative reasoning can be learned from routine clinical data, leading to significant improvements in diagnostic accuracy and retrieval performance in radiology.

Tengfei Zhang, Ziheng Zhao, Lisong Dai +5

Computer Vision Multimodal Models Reasoning & Chain-of-Thought

Jun 3, 2026

Genoria AIJun 3, 2026·also Artificial Intelligence Laboratory, Shanghai AI Lab, SJTU

Evaluating Large Language Models in Dynamic Clinical Decision-Making with Standardized Patient Cases

Static benchmarks fail to predict LLM performance in dynamic clinical settings, with top models only achieving 60.4% of expert criteria in real-world simulations.

Cheng Liang, Pengcheng Qiu, Ya Zhang +3

Eval Frameworks & Benchmarks Natural Language Processing Tool Use & Agents

May 28, 2026

May 28, 2026·also D auxiliary modalities (e.g. optical flow [Yang21a, SJTU

GMOS: Grounding Moving Object Segmentation in 3D Space and Time

Ditch slow, 2D motion proxies: GMOS directly segments moving objects from RGB video in 3D space and time, achieving state-of-the-art speed and accuracy.

Junyu Xie, Junyu Xie, Tengda Han +4

Computer Vision Robotics & Embodied AI

Search

Weidi Xie

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (5)