Entrenamiento

Aprendizaje Supervisado

Aprendizaje supervisado es un paradigma de aprendizaje automático en el que un modelo se entrena en un conjunto de datos etiquetado de pares entrada-salida para aprender una función de mapeo, luego se aplica para predecir salidas para entradas no vistas; subyace a la mayoría de sistemas de ML de producción desde filtros de spam a clasificadores de imágenes médicas.

Aprendizaje supervisado es el paradigma dominante de aprendizaje automático, en el cual un modelo se entrena en un conjunto de datos fijo de pares (entrada, etiqueta) para aproximar una función que mapea entradas a salidas. Los parámetros del modelo se ajustan para minimizar una función de pérdida que mide la discrepancia entre predicciones y etiquetas de verdad fundamental, usando optimización basada en gradientes como descenso de gradiente estocástico y sus variantes (Adam, AdamW). En tiempo de inferencia, se espera que el modelo entrenado generalice—produciendo predicciones precisas en entradas no vistas durante el entrenamiento.

El paradigma cubre dos tipos de tareas primarias: clasificación, donde la salida es una categoría discreta (detección de spam, reconocimiento de objetos en las 1.000 clases de ImageNet, análisis de sentimiento), y regresión, donde la salida es un valor continuo (estimación de precio de casa, pronóstico de temperatura). Las arquitecturas van desde regresión logística y árboles de decisión impulsados por gradientes—ampliamente usados en datos tabulares industriales—a redes neuronales convolucionales para imágenes y modelos Transformer para lenguaje. El flujo de trabajo estándar desde aproximadamente 2018 es pre-entrenar un modelo grande en un corpus masivo usando objetivos auto-supervisados, luego fine-tuning en conjuntos de datos etiquetados específicos de tarea más pequeños, reduciendo dramáticamente los requisitos de anotación.

La limitación central del aprendizaje supervisado es la necesidad de datos etiquetados, que son costosos y específicos del dominio. La anotación de imágenes médicas requiere tiempo de radiólogo; la clasificación de documentos legales requiere revisión de abogado. Aprendizaje activo, aumento de datos y aprendizaje por transferencia se han convertido en técnicas estándar para gestionar este costo. Los modelos de lenguaje que siguen instrucciones han introducido fine-tuning supervisado (SFT) como un paso crítico de alineación: pares (prompt, finalización) curados por humanos enseñan a un modelo pre-entrenado a responder útilmente a instrucciones antes de alineación adicional vía RLHF o DPO.

A partir de 2026, el aprendizaje supervisado sigue siendo fundamental en todos los sistemas de IA de producción. Detección de fraude, reconocimiento de voz, soporte de decisiones clínicas y las etapas SFT de cada pipeline de LLM principal dependen de él. El desempeño de benchmark en tareas supervisadas canónicas—ImageNet para visión, GLUE y SuperGLUE para NLP, SQuAD para comprensión de lectura—ha se aproximado o excedido la precisión a nivel humano en la mayoría de métricas, desplazando el énfasis de investigación hacia generalización fuera de distribución, robustez al ruido de etiquetas y aprendizaje con menos ejemplos etiquetados.

Ejemplo

Google entrena su clasificador de imágenes médicas para detectar retinopatía diabética exponiéndolo a cientos de miles de fotografías de retina etiquetadas por oftalmólogos; después del entrenamiento, el modelo logra precisión de detección a nivel de especialista en nuevas imágenes de pacientes que nunca ha visto.

Términos relacionados

← Glosario