Manan Gupta

BITS Pilani, India

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Eval Frameworks & Benchmarks (2)Constitutional AI & AI Ethics (1)Red-Teaming & Adversarial Robustness (1)Natural Language Processing (1)

Frequent co-authors

Dhruv Kumar (2)Inderjeet Nair (1)Lu Wang (1)

Papers (2)

Apr 16, 2026

BITS Pilani3d ago

Context Over Content: Exposing Evaluation Faking in Automated Judges

LLM judges can be subtly manipulated by framing the consequences of their decisions, leading to biased evaluations even when the content being judged remains constant.

Manan Gupta, Inderjeet Nair, Lu Wang +1

Constitutional AI & AI Ethics Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness

BITS Pilani3d ago

Diagnosing LLM Judge Reliability: Conformal Prediction Sets and Transitivity Violations

LLM judges are far less reliable on individual examples than aggregate metrics suggest: up to 67% of documents show judgment inconsistencies, and some criteria like fluency are essentially unjudgeable.

Manan Gupta, Dhruv Kumar

Eval Frameworks & Benchmarks Natural Language Processing

Search

Manan Gupta

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)