Xinzhu Ma

Beihang University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (3)Robotics & Embodied AI (2)Multimodal Models (1)Reasoning & Chain-of-Thought (1)

Frequent co-authors

Shufan Zhang (1)Ziyue Lin (1)Bairun Wang (1)Lei Jin (1)

Papers (3)

Jun 4, 2026

Tsinghua AI6d ago·also Beihang, Beijing Shanwei Zhixing Technology Co., Corresponding author, HKU

VTI-CoT: Visual-Textual Interleaved Chain of Thought for Video Reasoning

Integrating visual frames with textual reasoning steps, VTI-CoT achieves state-of-the-art video reasoning performance while boosting training efficiency.

Shufan Zhang, Ziyue Lin, Bairun Wang +4

Computer Vision Multimodal Models Reasoning & Chain-of-Thought

Jun 1, 2026

AI Laboratory1w ago·also Beihang, HIT, NTU, Oxford +4

Trans2Occ: Voxel Occupancy Estimation and Grasp for Transparent Objects from Simulation to Reality

Single-view RGB input can revolutionize how robots perceive and manipulate transparent objects, achieving reliable grasping without complex depth sensing.

Yixuan Yang, Sha Zhang, Rui Li +12

Computer Vision Robotics & Embodied AI

Feb 26, 2026

GraspLDP: Towards Generalizable Grasping Policy via Latent Diffusion

Achieve more precise and generalizable robot grasping by injecting grasp pose priors into latent diffusion policies, outperforming existing imitation learning methods.

Enda Xiang, Enda Xiang, Xinzhu Ma +3