Treinamento

Fine-tuning

Fine-tuning é o processo de treinar adicionalmente um modelo de IA pré-treinado em um dataset menor e específico da tarefa para que ele tenha melhor desempenho nessa tarefa. Em vez de construir um modelo do zero, você adapta um existente ao seu domínio, estilo ou formato de saída.

Fine-tuning pega um modelo base que já compreende linguagem e continua seu treinamento em um dataset restrito — típicamente centenas a dezenas de milhares de exemplos das entradas e saídas que você se importa. Os pesos do modelo se deslocam para sua tarefa: redação legal, codificação médica, tom de voz de uma marca ou um formato de saída rígido como JSON.

É melhor usado quando você precisa de comportamento consistente, não de conhecimento novo. Ensinar a um modelo novos fatos via fine-tuning é caro e pouco confiável — fatos mudam e o modelo ainda sofre alucinações. Ensinar-lhe um estilo, um formato ou uma política de decisão funciona bem, porque esses padrões se repetem nos exemplos de treinamento.

Na prática, equipes comparam três opções: prompt engineering (mais barato, sem treinamento), RAG (conhecimento fresco e privado) e fine-tuning (comportamento estável com custo mais baixo por requisição, já que instruções longas saem do prompt e vão para os pesos). Métodos eficientes de parâmetro como LoRA tornam o fine-tuning viável até mesmo em um único GPU.

Exemplo

Uma fintech realiza fine-tuning em um modelo pequeno com 5.000 chats de suporte anotados para que sempre classifique solicitações em 12 categorias e responda no tom da empresa.

Termos relacionados

Últimas notícias sobre o tema

← Glossário