Apprentissage fédéré
L'apprentissage fédéré est une technique d'apprentissage automatique qui entraîne un modèle partagé sur de nombreux appareils ou serveurs décentralisés sans centraliser les données brutes, transmettant uniquement les mises à jour des paramètres du modèle vers un serveur coordinateur pour préserver la vie privée.
L'apprentissage fédéré est un paradigme d'apprentissage automatique distribué conceptualisé par Google en 2016 et formalisé dans un article de 2017. Au lieu d'agréger les données brutes sur un serveur central, il garde les données sur les appareils ou les institutions qui les possèdent — téléphones intelligents, hôpitaux, institutions financières — et entraîne le modèle localement sur chaque nœud participant.
Au cours d'un tour d'entraînement fédéré standard, chaque client télécharge le modèle global actuel, l'entraîne sur son ensemble de données local pendant un nombre fixe d'étapes, et télécharge uniquement les mises à jour de poids résultantes (gradients ou deltas de modèle) vers le serveur. Le serveur agrège ces mises à jour — typiquement via Federated Averaging (FedAvg) — pour produire un modèle global amélioré, qui est ensuite redistribué. Ce cycle se répète jusqu'à la convergence.
L'apprentissage fédéré aborde deux préoccupations centrales : la confidentialité des données et la conformité réglementaire. Les organisations soumises au RGPD, à la HIPAA ou aux lois de secret financier ne peuvent souvent pas partager les données brutes entre les frontières ou les institutions. En gardant les données locales, l'apprentissage fédéré permet l'entraînement collaboratif de modèles sans exposition juridique ou éthique. Il réduit également les exigences de bande passante par rapport à la centralisation de grands ensembles de données.
Depuis 2026, l'apprentissage fédéré est en production à grande échelle. Google l'utilise pour la prédiction du mot suivant sur l'appareil dans Gboard et pour les modèles vocaux ; Apple l'applique aux fonctionnalités telles que QuickType et Siri sans télécharger le contenu de l'utilisateur. Les défis actuels de la recherche incluent l'efficacité de la communication, la gestion des données non-IID (non distribuées de manière identique) entre les clients, et la défense contre les attaques d'empoisonnement de modèle. Des frameworks tels que TensorFlow Federated, PySyft et NVIDIA FLARE ont rendu la technique accessible au-delà du milieu académique.