Zhengxiang Zhai

Papers on Lattice

Total citations

Topics

h-index

Research focus

Data Curation & Synthetic Data (1)RLHF & Preference Learning (1)Training Efficiency & Optimization (1)

Papers (1)

Sep 8, 2025

Zhengxiang ZhaiSep 8, 2025

Exploring the Optimization of RLHF and its Variants in Aligning Large Models with Human Preferences

RLHF's reliance on high-quality data can be significantly improved by token-level optimization, active learning, data augmentation, and multimodal feedback.

Zhengxiang Zhai

Data Curation & Synthetic Data RLHF & Preference Learning Training Efficiency & Optimization

Search

Zhengxiang Zhai

Research focus

Papers (1)