Shitian Zhao

Papers on Lattice

Total citations

Topics

Research focus

Multimodal Models (1)RLHF & Preference Learning (1)Tool Use & Agents (1)

Frequent co-authors

Shitian Zhao (1)Shaoheng Lin (1)Shaoheng Lin (1)Ming Li (1)

Papers (1)

Feb 24, 2026

Tsinghua AIFeb 24, 2026·also Shanghai AI Lab

PyVision-RL: Forging Open Agentic Vision Models via RL

Reinforcement learning for multimodal agents doesn't have to collapse into uselessness: PyVision-RL shows how to stabilize training and encourage multi-turn tool use.

Shitian Zhao, Shitian Zhao, Shaoheng Lin +5

Multimodal Models RLHF & Preference Learning Tool Use & Agents

Search

Shitian Zhao

Research focus

Frequent co-authors

Papers (1)