UCFApr 30, 2026arXiv:2604.27510

FMCL: Class-Aware Client Clustering with Foundation Model Representations for Heterogeneous Federated Learning

AI Summary

This paper introduces FMCL, a novel federated learning client clustering method that uses frozen foundation model embeddings to create class-aware client signatures. By computing class-level embedding prototypes for each client and clustering based on cosine similarity, FMCL captures semantic structure across heterogeneous domains without iterative coordination. Experiments on heterogeneous benchmarks show FMCL improves federated performance and clustering stability compared to existing methods.

Key Contribution

Foundation model embeddings reveal hidden structure in federated datasets, enabling surprisingly effective client clustering without any training or communication overhead.

Abstract

Federated Learning (FL) enables collaborative model training across distributed clients without sharing raw data, yet its performance deteriorates under statistical heterogeneity. Clustered Federated Learning addresses this challenge by grouping similar clients and training separate models per cluster. However, existing clustering strategies often rely on raw data statistics, model parameters, or heuristic similarity measures that fail to capture class-level semantic structure across heterogeneous domains and frequently require iterative coordination. We propose FMCL, a one-shot, class-aware client clustering framework that leverages foundation model representations to construct semantic client signatures. Using a frozen foundation model, FMCL computes class-level embedding prototypes for each client and measures similarity via cosine distance between their class-aware representations. Clustering is performed once prior to training, introducing no additional communication during federated optimization and remaining agnostic to the downstream model architecture. Extensive experiments across heterogeneous benchmarks demonstrate that FMCL improves federated performance and yields more stable clustering behavior compared to existing clustering-based methods under non-identically distributed data partitioning.

Data Curation & Synthetic Data Distributed Systems & Hardware Training Efficiency & Optimization

Citation Metrics

Citations0

Influential citations0

References0

Year2026

VenueN/A

Related Papers

Finding related papers...

Search

FMCL: Class-Aware Client Clustering with Foundation Model Representations for Heterogeneous Federated Learning

Related Papers