Apprentissage supervisé
L'apprentissage supervisé est un paradigme d'apprentissage automatique dans lequel un modèle est entraîné sur un ensemble de données étiqueté de paires entrée-sortie pour apprendre une fonction de cartographie, puis appliqué pour prédire les résultats pour les entrées non vues ; il sous-tend la plupart des systèmes ML en production, des filtres anti-spam aux classificateurs d'images médicales.
L'apprentissage supervisé est le paradigme d'apprentissage automatique dominant, dans lequel un modèle est entraîné sur un ensemble de données fixe de paires (entrée, étiquette) pour approximer une fonction cartographiant les entrées aux sorties. Les paramètres du modèle sont ajustés pour minimiser une fonction de perte mesurant la divergence entre les prédictions et les étiquettes de vérité terrestre, en utilisant l'optimisation basée sur le gradient telle que la descente de gradient stochastique et ses variantes (Adam, AdamW). Au moment de l'inférence, le modèle entraîné est censé se généraliser—produisant des prédictions précises sur les entrées non vues lors de l'entraînement.
Le paradigme couvre deux types de tâches principaux : la classification, où la sortie est une catégorie discrète (détection de spam, reconnaissance d'objets dans les 1 000 classes d'ImageNet, analyse des sentiments), et la régression, où la sortie est une valeur continue (estimation des prix des maisons, prévision de température). Les architectures varient de la régression logistique et des arbres de décision renforcés par gradient—largement utilisés sur les données tabulaires de l'industrie—aux réseaux de neurones convolutifs pour les images et aux modèles Transformer pour le langage. Le workflow standard depuis environ 2018 est de pré-entraîner un grand modèle sur un corpus massif en utilisant des objectifs auto-supervisés, puis d'affiner sur des ensembles de données étiquetées de plus petite taille spécifiques à la tâche, réduisant considérablement les exigences d'annotation.
La contrainte centrale de l'apprentissage supervisé est le besoin de données étiquetées, qui est coûteux et spécifique au domaine. L'annotation d'imagerie médicale nécessite du temps de radiologue ; la classification de documents juridiques nécessite un examen juridique. L'apprentissage actif, l'augmentation de données et l'apprentissage par transfert sont devenues des techniques standard pour gérer ce coût. Les modèles de langage suivant les instructions ont introduit l'affinage supervisé (SFT) comme étape d'alignement critique : les paires (prompt, complétion) curées par l'homme enseignent à un modèle pré-entraîné à répondre utile aux instructions avant un alignement ultérieur via RLHF ou DPO.
À partir de 2026, l'apprentissage supervisé reste fondamental dans les systèmes d'IA en production. La détection de fraude, la reconnaissance vocale, le soutien aux décisions cliniques et les étapes SFT de chaque pipeline LLM majeur en dépendent tous. Les performances de benchmark sur les tâches supervisées canoniques—ImageNet pour la vision, GLUE et SuperGLUE pour le traitement du langage naturel, SQuAD pour la compréhension de la lecture—ont approché ou dépassé la précision au niveau humain sur la plupart des métriques, décalant l'accent de la recherche vers la généralisation hors distribution, la robustesse au bruit des étiquettes et l'apprentissage à partir de moins d'exemples étiquetés.