Ruixiang Zhao

Renmin University of China

Papers on Lattice

Total citations

Topics

Research focus

Multimodal Models (2)Speech & Audio (2)Computer Vision (1)Eval Frameworks & Benchmarks (1)Recommendation & Information Retrieval (1)

Frequent co-authors

Zijie Xin (1)Tianyi Wang (1)Fengyun Rao (1)Jing Lyu (1)

Papers (2)

May 18, 2026

May 18, 2026·also PKU, Tencent AI

OmniPro: A Comprehensive Benchmark for Omni-Proactive Streaming Video Understanding

Current video understanding models struggle with long-horizon robustness and non-speech audio, as revealed by the new OmniPro benchmark designed for comprehensive omni-modal proactive evaluation.

Ruixiang Zhao, Zijie Xin, Tianyi Wang +3

Computer Vision Eval Frameworks & Benchmarks Multimodal Models+1

Mar 9, 2026

Mar 9, 2026·also Gaotu Techedu Inc

SAVE: Speech-Aware Video Representation Learning for Video-Text Retrieval

By explicitly modeling speech, SAVE leapfrogs existing audio-visual methods for video-text retrieval, achieving substantial gains over the state-of-the-art.

Ruixiang Zhao, Zhihao Xu

Multimodal Models Recommendation & Information Retrieval Speech & Audio

Search

Ruixiang Zhao

Research focus

Frequent co-authors

Papers (2)