Min Gu Kwak

University of Pittsburgh

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Natural Language Processing (1)Recommendation & Information Retrieval (1)RLHF & Preference Learning (1)

Frequent co-authors

Yuelyu Ji (1)Hang Zhang (1)Xizhi Wu (1)Chenyu Li (1)

Papers (1)

May 25, 2026

2w ago

What Makes a Medical Checker Trainable? Diagnosing Signal Collapse and Reward Hacking in Checker-Guided RAG for Biomedical QA

Seemingly strong NLI checkers can actually *hurt* medical RAG training by collapsing the RL gradient or triggering reward-hacking cascades like ultra-short answers and search avoidance.

Yuelyu Ji, Min Gu Kwak, Hang Zhang +3

Natural Language Processing Recommendation & Information Retrieval RLHF & Preference Learning

Search

Min Gu Kwak

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)