Treinamento

Aprendizado Federado

Aprendizado federado é uma técnica de machine learning que treina um modelo compartilhado entre muitos dispositivos ou servidores descentralizados sem centralizar dados brutos, transmitindo apenas atualizações de parâmetros do modelo para um servidor coordenador para preservar privacidade.

Aprendizado federado é um paradigma de machine learning distribuído conceituado pelo Google em 2016 e formalizado em um artigo de 2017. Ao invés de agregar dados brutos em um servidor central, ele mantém dados nos dispositivos ou instituições que os possuem — smartphones, hospitais, instituições financeiras — e treina o modelo localmente em cada nó participante.

Em uma rodada padrão de treinamento federado, cada cliente baixa o modelo global atual, o treina em seu conjunto de dados local por um número fixo de passos, e carrega apenas as atualizações de peso resultantes (gradientes ou deltas de modelo) para o servidor. O servidor agrega essas atualizações — tipicamente via Federated Averaging (FedAvg) — para produzir um modelo global melhorado, que é então redistribuído. Este ciclo se repete até convergência.

Aprendizado federado aborda duas preocupações centrais: privacidade de dados e conformidade regulatória. Organizações sujeitas a GDPR, HIPAA, ou leis de sigilo financeiro frequentemente não podem compartilhar dados brutos através de fronteiras ou instituições. Ao manter dados locais, aprendizado federado permite treinamento colaborativo de modelo sem exposição legal ou ética. Também reduz requisitos de largura de banda em comparação com centralizar grandes conjuntos de dados.

A partir de 2026, aprendizado federado está em produção em escala. Google o usa para previsão da próxima palavra no dispositivo no Gboard e para modelos de voz; Apple o aplica a recursos como QuickType e Siri sem carregar conteúdo do usuário. Desafios de pesquisa ativa incluem eficiência de comunicação, lidar com dados non-IID (não identicamente distribuídos) entre clientes, e defender contra ataques de envenenamento de modelo. Frameworks como TensorFlow Federated, PySyft, e NVIDIA FLARE tornaram a técnica acessível além de ambientes acadêmicos.

Exemplo

Um consórcio de hospitais europeus treina um modelo de detecção de tumor mantendo digitalizações de pacientes em seus próprios servidores; apenas atualizações de gradiente são compartilhadas com um coordenador central, então nenhuma imagem médica sai de cada instituição.

Termos relacionados

Data Privacy IA no Dispositivo Dados de Treinamento

Últimas notícias sobre o tema

Engenheiro da Eltex explica como executar aprendizado federado em dispositivos edge com 256 MB de memória2026-04-27

← Glossário