Aprendizado Federado
Aprendizado federado é uma técnica de machine learning que treina um modelo compartilhado entre muitos dispositivos ou servidores descentralizados sem centralizar dados brutos, transmitindo apenas atualizações de parâmetros do modelo para um servidor coordenador para preservar privacidade.
Aprendizado federado é um paradigma de machine learning distribuído conceituado pelo Google em 2016 e formalizado em um artigo de 2017. Ao invés de agregar dados brutos em um servidor central, ele mantém dados nos dispositivos ou instituições que os possuem — smartphones, hospitais, instituições financeiras — e treina o modelo localmente em cada nó participante.
Em uma rodada padrão de treinamento federado, cada cliente baixa o modelo global atual, o treina em seu conjunto de dados local por um número fixo de passos, e carrega apenas as atualizações de peso resultantes (gradientes ou deltas de modelo) para o servidor. O servidor agrega essas atualizações — tipicamente via Federated Averaging (FedAvg) — para produzir um modelo global melhorado, que é então redistribuído. Este ciclo se repete até convergência.
Aprendizado federado aborda duas preocupações centrais: privacidade de dados e conformidade regulatória. Organizações sujeitas a GDPR, HIPAA, ou leis de sigilo financeiro frequentemente não podem compartilhar dados brutos através de fronteiras ou instituições. Ao manter dados locais, aprendizado federado permite treinamento colaborativo de modelo sem exposição legal ou ética. Também reduz requisitos de largura de banda em comparação com centralizar grandes conjuntos de dados.
A partir de 2026, aprendizado federado está em produção em escala. Google o usa para previsão da próxima palavra no dispositivo no Gboard e para modelos de voz; Apple o aplica a recursos como QuickType e Siri sem carregar conteúdo do usuário. Desafios de pesquisa ativa incluem eficiência de comunicação, lidar com dados non-IID (não identicamente distribuídos) entre clientes, e defender contra ataques de envenenamento de modelo. Frameworks como TensorFlow Federated, PySyft, e NVIDIA FLARE tornaram a técnica acessível além de ambientes acadêmicos.