Shengyuan Ding

Papers on Lattice

Total citations

Topics

h-index

Research focus

Multimodal Models (4)Computer Vision (3)RLHF & Preference Learning (2)Eval Frameworks & Benchmarks (1)Tool Use & Agents (1)

Frequent co-authors

Yuhang Zang (2)Fanqing Meng (1)Lingxiao Du (1)Zijian Wu (1)

Papers (4)

Apr 26, 2026

UWApr 26, 2026·also HKUST

ClawMark: A Living-World Benchmark for Multi-Turn, Multi-Day, Multimodal Coworker Agents

LLM agents struggle to maintain performance in multi-day collaborative tasks, dropping significantly after just one environmental update, revealing a critical gap in adaptation to evolving real-world conditions.

Fanqing Meng, Lingxiao Du, Zijian Wu +42

Eval Frameworks & Benchmarks Multimodal Models Tool Use & Agents

Mar 13, 2026

Mar 13, 2026·also BUPT, Fudan, NTU, Shanghai AI Lab +2

Visual-ERM: Reward Modeling for Visual Equivalence

Forget textual rules and coarse embeddings: a multimodal reward model that directly compares rendered visuals unlocks significant gains in vision-to-code RL.

Ziyu Liu, Shengyuan Ding, Xinyu Fang +4

Computer Vision Multimodal Models RLHF & Preference Learning

Mar 12, 2026

Mar 12, 2026·also NTU

Trust Your Critic: Robust Reward Modeling and Reinforcement Learning for Faithful Image Editing and Generation

Hallucinations in RL-based image editing and generation are tamed with FIRM, a new framework that trains robust reward models on curated datasets to provide more accurate guidance.

Xiangyu Zhao, Peiyuan Zhang, Junming Lin +8

Computer Vision Multimodal Models RLHF & Preference Learning

Feb 12, 2026

Feb 12, 2026·also Li Auto, Qingdao University Hospital, School of Computing and Artificial Intelligence, Shanghai Innovation +3

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

A 5B model just crushed the image generation and editing performance of models 5-16x larger, thanks to smarter feature fusion and a novel RL training strategy.

Ruihang Li, Feng Han, Wei Song +14

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Search

Shengyuan Ding

Research focus

Frequent co-authors

Papers (4)