Binod Bhattarai

University of Aberdeen, UK

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (2)RLHF & Preference Learning (1)Scalable Oversight & Alignment Theory (1)Distributed Systems & Hardware (1)

Frequent co-authors

Shourov Joarder (1)Diganta Sikdar (1)Ahsan Habib Akash (1)Prashnna Gyawali (1)

Papers (2)

May 21, 2026

2w ago·also University of Aberdeen, West Virginia University

Two is better than one: A Collapse-free Multi-Reward RLIF Training Framework

Forget reward hacking and entropy collapse: multi-reward RLIF, combining answer-level and completion-level signals, unlocks stable and robust LLM reasoning without human supervision.

Shourov Joarder, Diganta Sikdar, Ahsan Habib Akash +2

RLHF & Preference Learning Scalable Oversight & Alignment Theory Training Efficiency & Optimization

Feb 24, 2026

West Virginia UniversityFeb 24, 2026·also University of Aberdeen

FedVG: Gradient-Guided Aggregation for Enhanced Federated Learning

By weighting client updates based on validation gradient norms, FedVG offers a simple yet effective way to mitigate client drift in federated learning, outperforming volume-based aggregation strategies.

Alina Devkota, Jacob Thrasher, Donald Adjeroh +2

Distributed Systems & Hardware Training Efficiency & Optimization

Search

Binod Bhattarai

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)