Shweta Singh

Indian Institute of Technology Roorkee, Lossfunk {shivank_g@mfs, ayush_s@mt, shweta_s@mfs}.iitr.ac.in, paras@lossfunk.com Abstract 00footnotetext: *Equal contribution.

Papers on Lattice

Total citations

Topics

h-index

Research focus

Natural Language Processing (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Frequent co-authors

Shivank Garg (1)Ayush Singh (1)Paras Chopra (1)

Papers (1)

Feb 22, 2025

Shivank Garg +3Feb 22, 2025·also IIT

IPO: Your Language Model is Secretly a Preference Classifier

Ditch the expensive reward model: your LLM already knows what it likes, and IPO shows you how to use that for preference optimization.

Shivank Garg, Ayush Singh, Shweta Singh +112

Natural Language Processing RLHF & Preference Learning Training Efficiency & Optimization

Search

Shweta Singh

Research focus

Frequent co-authors

Papers (1)