Jingyan Shen

Papers on Lattice

Total citations

Topics

Research focus

Data Curation & Synthetic Data (1)Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)

Frequent co-authors

Salman Rahman (1)Anna Mordvina (1)Hamid Palangi (1)Saadia Gabriel (1)

Papers (1)

Apr 20, 2026

Google ResearchApr 20, 2026

When Can LLMs Learn to Reason with Weak Supervision?

Generalization in LLMs hinges on training reward saturation dynamics, with reasoning faithfulness emerging as a critical predictor of success under weak supervision.

Salman Rahman, Jingyan Shen, Anna Mordvina +2

Data Curation & Synthetic Data Reasoning & Chain-of-Thought RLHF & Preference Learning

Search

Jingyan Shen

Research focus

Frequent co-authors

Papers (1)