Treinamento

Aprendizado Contínuo

Aprendizado contínuo é um paradigma de machine learning no qual um modelo aprende de um fluxo contínuo de tarefas ou dados ao longo do tempo enquanto mantém desempenho no conhecimento previamente adquirido, sem retreinar completamente do zero.

Aprendizado contínuo (também chamado aprendizado vitalício ou aprendizado incremental) aborda uma das lacunas mais significativas entre a inteligência artificial e a biológica: a capacidade de acumular conhecimento progressivamente sem esquecer catastroficamente o que foi aprendido antes. No deep learning padrão, modelos são treinados uma vez em um conjunto de dados fixo e depois implantados estaticamente. Aprendizado contínuo substitui isso por um processo contínuo onde novas tarefas, classes ou distribuições de dados chegam sequencialmente e o modelo deve integrá-las sem acesso simultâneo a todos os dados de treinamento anterior.

O campo distingue várias configurações de problemas. Aprendizado incremental por tarefa assume que o modelo sabe qual tarefa está executando no tempo de inferência. Aprendizado incremental por classe requer classificação entre todas as classes vistas anteriormente sem pistas de identidade de tarefa—um problema substancialmente mais difícil. Aprendizado incremental de domínio apresenta o mesmo tipo de tarefa, mas com distribuições de entrada mudando, como imagens capturadas sob condições diferentes ao longo do tempo. Cada configuração impõe restrições diferentes sobre como o esquecimento se manifesta e como deve ser medido.

Técnicas fundamentais se enquadram em três famílias. Abordagens baseadas em regularização, como elastic weight consolidation (EWC) e inteligência sináptica, identificam quais pesos importam para tarefas anteriores e restringem suas atualizações durante novo treinamento. Métodos baseados em ensaio mantêm uma pequena memória episódica de exemplos passados—ou usam um modelo generativo para sintetizar pseudo-exemplos—e intercalam-nos com dados novos. Abordagens baseadas em arquitetura alocam capacidade de rede separada ou expansível por tarefa, protegendo conhecimento antigo através de isolamento. Grandes modelos de fundação pré-treinados deslocaram a paisagem prática: fine-tuning deles com métodos parameter-efficient como LoRA ou prefix tuning causa substancialmente menos esquecimento do que treinar modelos específicos de tarefa do zero, tornando essas técnicas diretamente relevantes para a prática de aprendizado contínuo.

A partir de 2026, aprendizado contínuo é cada vez mais importante para implantar modelos de linguagem que devem se adaptar a novas informações—eventos recentes, fatos atualizados, conhecimento específico do usuário—sem ciclos completos de retreinamento. Retrieval-augmented generation (RAG) oferece uma estratégia complementar externalizando novo conhecimento para um banco de dados pesquisável ao invés de codificá-lo em pesos. Suites de benchmark incluindo Continual World e CLEVA medem o progresso, embora o campo ainda careça de um único padrão de avaliação acordado.

Exemplo

Um sistema de imagem médica implantado em um hospital é atualizado mensalmente com casos recém-anotados de patologias emergentes; uma abordagem de aprendizado contínuo permite que melhore no diagnóstico das novas condições enquanto mantém precisão nas condições estabelecidas que foi originalmente treinado a detectar.

Termos relacionados

Últimas notícias sobre o tema

← Glossário