Jia Wan

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (3)Architecture Design (Transformers, SSMs, MoE) (2)Multimodal Models (2)Robotics & Embodied AI (1)

Frequent co-authors

Antoni B. Chan (2)Yichi Zhang (1)Yichi Zhang (1)Weihao Yuan (1)

Papers (3)

Mar 30, 2026

Yichi Zhang +82d ago

FocusVLA: Focused Visual Utilization for Vision-Language-Action Models

VLA models struggle not with *what* they see, but with *how* they see it: FocusVLA reveals that directing attention to task-relevant visual regions unlocks significant performance gains in robotic manipulation.

Yichi Zhang, Yichi Zhang, Weihao Yuan +6

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models+1

Mar 18, 2026

2w ago

M2P: Improving Visual Foundation Models with Mask-to-Point Weakly-Supervised Learning for Dense Point Tracking

By cleverly using readily available video segmentation masks, this method boosts DINOv2's point tracking performance by over 14% – a surprisingly effective way to inject temporal awareness into static image-pretrained models.

Qiangqiang Wu, Tianyu Yang, Jia Wan +3

Computer Vision Multimodal Models Training Efficiency & Optimization

Mar 17, 2026

2w ago·also Princeton

Exclusivity-Guided Mask Learning for Semi-Supervised Crowd Instance Segmentation and Counting

Achieve state-of-the-art semi-supervised crowd instance segmentation and counting by generating high-quality mask supervision from sparse annotations, effectively bridging the gap between these two tasks.

Jiyang Huang, Hongru Cheng, Wei Lin +2

Architecture Design (Transformers, SSMs, MoE)Computer Vision Data Curation & Synthetic Data

Search

Jia Wan

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)