CMU MLApr 9, 2026arXiv:2604.07739

Efficient Dataset Selection for Continual Adaptation of Generative Recommenders

Cathy Jiao, Juan Elenter, Praveen Ravichandran, Bernd Huber, Joseph Cauteruccio, T. Wasson, Todd Wasson, Timothy Heath, T. Heath, Chenyan Xiong, Mounia Lalmas, M. Lalmas, Paul Bennett, Paul N. Bennett

AI Summary

This paper explores efficient data selection strategies for continual adaptation of generative recommendation models facing temporal distribution shifts. They compare representation choices (including gradient-based representations) and sampling strategies for curating informative data subsets. Results show that gradient-based representations combined with distribution matching achieve training efficiency gains and maintain robustness to drift in production recommendation systems.

Key Contribution

Forget full retraining: intelligently selecting data subsets using gradient-based representations can keep your generative recommender fresh and robust to drift.

Abstract

Recommendation systems must continuously adapt to evolving user behavior, yet the volume of data generated in large-scale streaming environments makes frequent full retraining impractical. This work investigates how targeted data selection can mitigate performance degradation caused by temporal distributional drift while maintaining scalability. We evaluate a range of representation choices and sampling strategies for curating small but informative subsets of user interaction data. Our results demonstrate that gradient-based representations, coupled with distribution-matching, improve downstream model performance, achieving training efficiency gains while preserving robustness to drift. These findings highlight data curation as a practical mechanism for scalable monitoring and adaptive model updates in production-scale recommendation systems.

Data Curation & Synthetic Data Recommendation & Information Retrieval Training Efficiency & Optimization

Citation Metrics

Citations0

Influential citations0

References25

Year2026

VenueN/A

Related Papers

Finding related papers...

Search

Efficient Dataset Selection for Continual Adaptation of Generative Recommenders

Related Papers