Jaewoong Cho

Papers on Lattice

Total citations

Topics

h-index

Research focus

Natural Language Processing (1)RLHF & Preference Learning (1)Scalable Oversight & Alignment Theory (1)

Frequent co-authors

Jihun Yun (1)Juno Kim (1)Jongho Park (1)Junhyuck Kim (1)

Papers (1)

Jun 2, 2025

Jihun Yun +6Jun 2, 2025

Alignment as Distribution Learning: Your Preference Model is Explicitly a Language Model

Forget RLHF's quirks: aligning LLMs is fundamentally a distribution learning problem, and preference distillation offers a theoretically sound and empirically strong alternative.

Jihun Yun, Juno Kim, Jongho Park +4

Natural Language Processing RLHF & Preference Learning Scalable Oversight & Alignment Theory

Search

Jaewoong Cho

Research focus

Frequent co-authors

Papers (1)