Fuxun Yu

Microsoft

Microsoft Research

Papers on Lattice

Total citations

Topics

Research focus

Code Generation & Program Synthesis (1)Data Curation & Synthetic Data (1)RLHF & Preference Learning (1)

Frequent co-authors

Youpeng Li (1)Xinda Wang (1)

Papers (1)

Feb 15, 2026

Feb 15, 2026·also Microsoft Research

From SFT to RL: Demystifying the Post-Training Pipeline for LLM-based Vulnerability Detection

On-policy RL (GRPO) makes LLMs significantly better at vulnerability detection than SFT or preference optimization, outperforming even strong zero-shot baselines.

Youpeng Li, Fuxun Yu, Xinda Wang

Code Generation & Program Synthesis Data Curation & Synthetic Data RLHF & Preference Learning

Search

Fuxun Yu

Research focus

Frequent co-authors

Papers (1)