Xuming He

B LLM consistently underperforming compared to the

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (2)Multimodal Models (2)Natural Language Processing (1)Robotics & Embodied AI (1)

Frequent co-authors

Shan Ning (1)Longtian Qiu (1)Jiaxuan Sun (1)Xiaofei Wu (1)

Papers (2)

Mar 10, 2026

B LLM consistently underperforming6d ago·also B and

WikiCLIP: An Efficient Contrastive Baseline for Open-domain Visual Entity Recognition

Forget slow generative models: WikiCLIP delivers a 16% accuracy boost in visual entity recognition with 100x faster inference by cleverly combining CLIP-style contrastive learning with vision-guided knowledge adaptation.

Shan Ning, Longtian Qiu, Jiaxuan Sun +1

Computer Vision Multimodal Models Natural Language Processing

Mar 9, 2026

1w ago·also B LLM consistently underperforming

AffordGrasp: Cross-Modal Diffusion for Affordance-Aware Grasp Synthesis

Diffusion models can now generate more realistic and semantically appropriate hand grasps by explicitly modeling affordances and interaction semantics, outperforming prior methods on grasp quality, semantic accuracy, and diversity.

Xiaofei Wu, Yi Zhang, Yumeng Liu +3

Computer Vision Multimodal Models Robotics & Embodied AI

Search

Xuming He

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)