Aprendizaje Continuo
El aprendizaje continuo es un paradigma de aprendizaje automático en el que un modelo aprende de un flujo continuo de tareas o datos en el tiempo mientras mantiene el rendimiento en el conocimiento previamente adquirido, sin necesidad de reentrenamiento completo desde cero.
El aprendizaje continuo (también llamado aprendizaje de por vida o aprendizaje incremental) aborda una de las brechas más significativas entre la inteligencia artificial y la biológica: la capacidad de acumular conocimiento progresivamente sin olvidar catastróficamente lo que se aprendió antes. En el aprendizaje profundo estándar, los modelos se entrenan una vez en un conjunto de datos fijo y luego se despliegan estáticamente. El aprendizaje continuo reemplaza esto con un proceso continuo en el que nuevas tareas, clases o distribuciones de datos llegan secuencialmente y el modelo debe integrarlas sin acceso simultáneo a todos los datos de entrenamiento anteriores.
El campo distingue varios escenarios de problemas. El aprendizaje incremental por tareas asume que el modelo sabe qué tarea está realizando en el momento de la inferencia. El aprendizaje incremental por clases requiere clasificación entre todas las clases vistas previamente sin señales de identidad de tarea—un problema sustancialmente más difícil. El aprendizaje incremental por dominio presenta el mismo tipo de tarea pero con distribuciones de entrada cambiantes, como imágenes capturadas bajo diferentes condiciones en el tiempo. Cada escenario impone diferentes restricciones sobre cómo se manifiesta el olvido y cómo debe medirse.
Las técnicas principales se dividen en tres familias. Los enfoques basados en regularización, como la consolidación de pesos elásticos (EWC) e inteligencia sináptica, identifican qué pesos importan para tareas anteriores y restringen sus actualizaciones durante el nuevo entrenamiento. Los métodos basados en ensayos mantienen una pequeña memoria episódica de ejemplos anteriores—o usan un modelo generativo para sintetizar pseudo-ejemplos—e intercalan con nuevos datos. Los enfoques basados en arquitectura asignan capacidad de red separada o expandida por tarea, protegiendo el conocimiento antiguo a través del aislamiento. Los grandes modelos base preentrenados han cambiado el panorama práctico: fine-tuning con métodos eficientes en parámetros como LoRA o prefix tuning causa sustancialmente menos olvido que entrenar modelos específicos de tareas desde cero, haciendo estas técnicas directamente relevantes para la práctica de aprendizaje continuo.
A partir de 2026, el aprendizaje continuo es cada vez más importante para desplegar modelos de lenguaje que deben adaptarse a nueva información—eventos recientes, hechos actualizados, conocimiento específico del usuario—sin ciclos de reentrenamiento completos. La generación aumentada por recuperación (RAG) ofrece una estrategia complementaria al externalizar nuevo conocimiento a una base de datos buscable en lugar de codificarlo en pesos. Las suites de benchmark incluyendo Continual World y CLEVA miden el progreso, aunque el campo aún carece de un único estándar de evaluación acordado.