Bing Qin

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

RLHF & Preference Learning (3)Computer Vision (2)Multimodal Models (2)Natural Language Processing (2)

Frequent co-authors

Xiaocheng Feng (4)Qiming Li (2)Zekai Ye (2)Xiachong Feng (2)

Papers (5)

May 6, 2026

Qiming Li +11May 6, 2026·also HIT, Peng Cheng Laboratory

CAST: Mitigating Object Hallucination in Large Vision-Language Models via Caption-Guided Visual Attention Steering

Steer LVLMs' attention with caption guidance and watch object hallucinations drop by 6%—no training required.

Qiming Li, Zekai Ye, Xiaocheng Feng +9

Computer Vision Multimodal Models

Apr 21, 2026

SAVOIR: Learning Social Savoir-Faire via Shapley-based Reward Attribution

Social intelligence may require more than just reasoning power: a 7B model trained with SAVOIR beats GPT-4o and Claude-3.5-Sonnet on social interaction tasks.

Xiachong Feng, Yilei Jiang, Xiaocheng Feng +9

Natural Language Processing RLHF & Preference Learning Tool Use & Agents

Apr 20, 2026

Apr 20, 2026·also HIT

Stratagem: Learning Transferable Reasoning via Trajectory-Modulated Game Self-Play

STRATAGEM reveals that selectively reinforcing reasoning trajectories can dramatically enhance a model's ability to transfer reasoning skills across diverse tasks, especially in complex mathematical scenarios.

Xiachong Feng, Xiaocheng Feng, Weitao Ma +3

Reasoning & Chain-of-Thought World Models & Planning

Apr 2, 2026

Not All Tokens See Equally: Perception-Grounded Policy Optimization for Large Vision-Language Models

LVLMs can be boosted by 18.7% simply by focusing RLHF training on the few tokens that actually depend on visual input.

Zekai Ye, Qiming Li, Xiaocheng Feng +5

Computer Vision Multimodal Models RLHF & Preference Learning

Mar 4, 2026

Mar 4, 2026·also ZJU

Bootstrapping Exploration with Group-Level Natural Language Feedback in Reinforcement Learning

Unlock 2x faster reinforcement learning by distilling group feedback into actionable language refinements that guide exploration.

Lei Huang, Xiang Cheng, Xiang Cheng +10