Yuan Wang

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (4)Computer Vision (3)Eval Frameworks & Benchmarks (2)Reasoning & Chain-of-Thought (2)

Frequent co-authors

Jianhui Wei (2)Songtao Jiang (2)Zhihang Tang (2)Zuozhu Liu (2)

Papers (6)

Apr 22, 2026

Heng Liu +53d ago

How is a gas sensor poisoned by volatile methylsiloxanes?

AI-guided simulations reveal the precise mechanisms of siloxane poisoning in gas sensors, paving the way for designing sensors that resist degradation.

Heng Liu, Bingxin Yang, Yuan Wang +3

Scientific Discovery & Drug Design

Apr 21, 2026

Xiaotian Zhang +104d ago

How Far Are Video Models from True Multimodal Reasoning?

Today's best video models achieve near-zero success rates on interactive video generation, revealing a stark gap in multimodal reasoning and physical grounding.

Xiaotian Zhang, Jianhui Wei, Yuan Wang +8

Eval Frameworks & Benchmarks Multimodal Models Reasoning & Chain-of-Thought

Apr 16, 2026

Meijia Wang +61w ago

Frequency-Enhanced Dual-Subspace Networks for Few-Shot Fine-Grained Image Classification

By explicitly disentangling and fusing spatial textures with frequency-based structural features, FEDSNet achieves state-of-the-art few-shot fine-grained classification, demonstrating that frequency information is crucial for overcoming texture biases and improving robustness.

Meijia Wang, Guochao Wang, Haozhen Chu +4

Architecture Design (Transformers, SSMs, MoE)Computer Vision Training Efficiency & Optimization

Mar 18, 2026

Tsinghua AIMar 18, 2026·also DAMO, ZJU

Learning Transferable Temporal Primitives for Video Reasoning via Synthetic Videos

Forget real-world video datasets: training VLMs on just 7.7K synthetic videos with temporal primitives beats 165K real-world examples, unlocking surprisingly effective transfer learning for video reasoning.

Songtao Jiang, Sibo Song, Chenyi Zhou +10

Computer Vision Data Curation & Synthetic Data Multimodal Models

Feb 25, 2026

Tsinghua AIFeb 25, 2026·also USTC

Enhancing Multi-Modal LLMs Reasoning via Difficulty-Aware Group Normalization

Multimodal LLMs get a serious reasoning boost from Durian, a difficulty-aware normalization that tames the instability caused by extreme samples and noisy rewards.

Jinghan Li, Yuan Wang, Xiangnan He

Multimodal Models Reasoning & Chain-of-Thought Training Efficiency & Optimization

Tsinghua AIFeb 25, 2026·also UBC, ZJU

UniVBench: Towards Unified Evaluation for Video Foundation Models

Current video benchmarks are too simple; UniVBench offers the first unified framework to measure the integrated capabilities of video foundation models using complex, multi-shot videos and a standardized evaluation system.

Jianhui Wei, Jianhui Wei, Xiaotian Zhang +8

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Search

Yuan Wang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (6)