Treinamento

Aprendizado Supervisionado

Aprendizado supervisionado é um paradigma de aprendizado de máquina no qual um modelo é treinado em um conjunto de dados rotulado de pares entrada-saída para aprender uma função de mapeamento, então aplicado para prever saídas para entradas não vistas; ele fundamenta a maioria dos sistemas de ML de produção desde filtros de spam até classificadores de imagens médicas.

Aprendizado supervisionado é o paradigma dominante de aprendizado de máquina, no qual um modelo é treinado em um conjunto de dados fixo de pares (entrada, rótulo) para aproximar uma função que mapeia entradas para saídas. Os parâmetros do modelo são ajustados para minimizar uma função de perda medindo discrepância entre predições e rótulos de verdade fundamental, usando otimização baseada em gradiente como descida de gradiente estocástico e suas variantes (Adam, AdamW). No tempo de inferência, espera-se que o modelo treinado generalize—produzindo predições precisas em entradas não vistas durante o treinamento.

O paradigma cobre dois tipos de tarefas primárias: classificação, onde a saída é uma categoria discreta (detecção de spam, reconhecimento de objeto nas 1.000 classes do ImageNet, análise de sentimento), e regressão, onde a saída é um valor contínuo (estimação de preço de casa, previsão de temperatura). Arquiteturas variam de regressão logística e árvores de decisão impulsionadas por gradiente—amplamente usadas em dados tabulares da indústria—até redes neurais convolucionais para imagens e modelos Transformer para linguagem. O fluxo de trabalho padrão desde aproximadamente 2018 é pré-treinar um modelo grande em um corpus massivo usando objetivos auto-supervisionados, então aperfeiçoar em conjuntos de dados rotulados menores específicos de tarefa, reduzindo dramaticamente os requisitos de anotação.

A restrição central do aprendizado supervisionado é a necessidade de dados rotulados, que é cara e específica do domínio. Anotação de imagem médica requer tempo de radiologista; classificação de documento legal requer revisão de advogado. Aprendizado ativo, aumento de dados e aprendizado de transferência tornaram-se técnicas padrão para gerenciar esse custo. Modelos de linguagem que seguem instruções introduziram fine-tuning supervisionado (SFT) como uma etapa crítica de alinhamento: pares (prompt, conclusão) com curador humano ensinam um modelo pré-treinado a responder com utilidade a instruções antes do alinhamento adicional via RLHF ou DPO.

A partir de 2026, aprendizado supervisionado permanece fundamental em todos os sistemas de IA de produção. Detecção de fraude, reconhecimento de fala, suporte de decisão clínica e os estágios de SFT de cada pipeline LLM principal dependem dele. O desempenho de benchmark em tarefas supervisionadas canônicas—ImageNet para visão, GLUE e SuperGLUE para PNL, SQuAD para compreensão de leitura—se aproximou ou excedeu precisão em nível humano na maioria das métricas, deslocando ênfase de pesquisa para generalização fora da distribuição, robustez a ruído de rótulo e aprendizado a partir de menos exemplos rotulados.

Exemplo

Google treina seu classificador de imagem médica para detectar retinopatia diabética ao expô-lo a centenas de milhares de fotografias de retina rotuladas por oftalmologistas; após o treinamento, o modelo atinge precisão de rastreamento em nível de especialista em novas imagens de pacientes que nunca viu.

Termos relacionados

← Glossário