Yuxuan Gu

Harbin Institute of Technology

Papers on Lattice

Total citations

Topics

h-index

Research focus

Natural Language Processing (2)RLHF & Preference Learning (2)Tool Use & Agents (2)

Frequent co-authors

Xiaocheng Feng (2)Lei Huang (2)Bing Qin (2)Xiachong Feng (1)

Papers (2)

Apr 21, 2026

SAVOIR: Learning Social Savoir-Faire via Shapley-based Reward Attribution

Social intelligence may require more than just reasoning power: a 7B model trained with SAVOIR beats GPT-4o and Claude-3.5-Sonnet on social interaction tasks.

Xiachong Feng, Yilei Jiang, Xiaocheng Feng +9

Natural Language Processing RLHF & Preference Learning Tool Use & Agents

Mar 4, 2026

Mar 4, 2026·also ZJU

Bootstrapping Exploration with Group-Level Natural Language Feedback in Reinforcement Learning

Unlock 2x faster reinforcement learning by distilling group feedback into actionable language refinements that guide exploration.

Lei Huang, Xiang Cheng, Xiang Cheng +10

Natural Language Processing RLHF & Preference Learning Tool Use & Agents

Search

Yuxuan Gu

Research focus

Frequent co-authors

Papers (2)