Ruizhe Chen

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (3)Eval Frameworks & Benchmarks (2)Data Curation & Synthetic Data (2)Computer Vision (2)

Frequent co-authors

Junyang Lin (2)Zuozhu Liu (2)Qiuyue Wang (1)Mingsheng Li (1)

Papers (5)

May 28, 2026

Qiuyue Wang +432w ago·also Astronex Robotics, Mitsubishi Electric Research Laboratories (MERL), Normal University, ZJU

Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments

One model to control them all: Qwen-VLA achieves impressive zero-shot generalization across diverse robotic tasks and embodiments by unifying vision-language-action modeling.

Qiuyue Wang, Mingsheng Li, Jian Guan +41

Multimodal Models Robotics & Embodied AI Tool Use & Agents

Wanghan Xu +392w ago·also Tsinghua AI, SCUT, Shanghai AI Lab, SJTU +1

ResearchClawBench: A Benchmark for End-to-End Autonomous Scientific Research

Current AI agents struggle to reliably rediscover scientific knowledge, with top performers averaging only 21.5 out of a possible score, revealing critical gaps in their research capabilities.

Wanghan Xu, Shuo Li, Tianlin Ye +37

Eval Frameworks & Benchmarks Scientific Discovery & Drug Design

Apr 1, 2026

Apr 1, 2026·also Ant Group

Optimsyn: Influence-Guided Rubrics Optimization for Synthetic Data Generation

Synthetic data that looks good can still tank your model's performance – Optimsyn uses influence functions to find the *actually* useful synthetic examples and optimize your generation rubrics.

Zhiting Fan, Ruizhe Chen, Tianxiang Hu +5

Data Curation & Synthetic Data Eval Frameworks & Benchmarks RLHF & Preference Learning

Mar 18, 2026

Tsinghua AIMar 18, 2026·also DAMO

Learning Transferable Temporal Primitives for Video Reasoning via Synthetic Videos

Forget real-world video datasets: training VLMs on just 7.7K synthetic videos with temporal primitives beats 165K real-world examples, unlocking surprisingly effective transfer learning for video reasoning.

Songtao Jiang, Sibo Song, Chenyi Zhou +7

Computer Vision Data Curation & Synthetic Data Multimodal Models

Mar 4, 2026

Mar 4, 2026·also DAMO, Tsinghua AI

From Narrow to Panoramic Vision: Attention-Guided Cold-Start Reshapes Multimodal Reasoning

Multimodal models are often blind at birth: a new "Visual Attention Score" reveals they struggle to focus on visual inputs during cold-start, but a simple attention-guided fix can boost performance by 7%.

Chufan Shi, Yizhen Zhang, Ruizhe Chen +2

Computer Vision Interpretability & Mechanistic Interp Multimodal Models+1

Search

Ruizhe Chen

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (5)