MIT News→ original

MIT Acelera Treinamento Privado de IA em Dispositivos Comuns para Medicina e Finanças

MIT apresentou o método FTTE, que acelera o aprendizado federado de IA em smartphones, sensores e smartwatches sem enviar dados brutos para a nuvem. Em…

Processado por IA de MIT News; editado por Hamidun News
MIT Acelera Treinamento Privado de IA em Dispositivos Comuns para Medicina e Finanças
Fonte: MIT News. Colagem: Hamidun News.
◐ Ouvir artigo

Pesquisadores do MIT demonstraram uma maneira de acelerar significativamente o aprendizado federado — uma abordagem na qual a IA é refinada diretamente nos dispositivos dos usuários, e dados brutos nunca deixam o smartphone, smartwatch ou sensor. O novo método deve ajudar a implantar modelos mais precisos em saúde, finanças e outros cenários sensíveis, mesmo onde os dispositivos são menos potentes e a conectividade é instável.

Por que a rede fica lenta

O aprendizado federado há muito é considerado uma das abordagens mais práticas para treinar modelos sem coleta centralizada de dados pessoais. Um servidor distribui um modelo comum para muitos dispositivos, cada um refina-o com seus dados locais e, em seguida, retorna apenas atualizações de parâmetros. Dessa forma, informações de telefones, smartwatches e sensores podem ser usadas sem fazer upload dos próprios dados na nuvem.

O problema é que uma rede real desses dispositivos quase nunca é uniforme: alguns têm memória limitada, outros têm processadores fracos e ainda outros têm conexões instáveis. Por isso, o esquema clássico começa a falhar. Normalmente, o servidor central aguarda atualizações de todos os participantes de uma rodada antes de prosseguir. Se até alguns dispositivos responderem muito lentamente, todo o processo se arrasta e às vezes fica impraticável. Para cenários do mundo real, esse é um obstáculo sério: em saúde, bancos e outros campos sensíveis, tanto privacidade quanto estabilidade são importantes, mas são precisamente as áreas onde a infraestrutura limitada é frequentemente disponível.

Como funciona o FTTE

A equipe do MIT propôs um framework FTTE — Federated Tiny Training Engine. Seu objetivo é simples: permitir que até os dispositivos mais fracos participem do treinamento sem quebrar todo o sistema com atrasos e transferências desnecessárias de dados. A abordagem é construída em torno de três mudanças técnicas e um princípio geral: adaptar o processo não para um smartphone ideal, mas para o nó mais restrito da rede.

  • O servidor envia aos dispositivos não todo o modelo, mas apenas uma parte dos parâmetros suficientes para uma etapa de treinamento local.
  • O conjunto de parâmetros é selecionado usando um procedimento de busca especial para se ajustar ao limite de memória do dispositivo mais fraco.
  • As atualizações são aceitas de forma semi-assíncrona: o servidor não aguarda todos os participantes, mas continua a rodada assim que respostas suficientes são coletadas.
  • As atualizações mais antigas recebem menos peso, de modo que dados atrasados não desacelerem o treinamento e não degradem a precisão final.
"Precisamos que a IA funcione em dispositivos que as pessoas carregam consigo todos os dias, não apenas em grandes servidores e GPUs", explica a pesquisadora

Irene Tenison.

Este design aborda dois problemas de uma vez: escassez de memória no próprio dispositivo e atrasos desnecessários do lado do servidor. Em vez de excluir dispositivos lentos do processo, os desenvolvedores tentam mantê-los no loop para que o modelo aprenda com dados mais diversos. Isso é especialmente importante em áreas onde os usuários não têm telefones de ponta e conectividade cara, mas têm dados que podem melhorar a qualidade do modelo.

O que os testes mostraram

Em simulações com centenas de dispositivos heterogêneos, o FTTE acelerou significativamente o treinamento em comparação com abordagens padrão de aprendizado federado. Em média, o sistema completou o treinamento 81% mais rápido, reduziu custos de memória local em aproximadamente 80% e diminuiu o volume de transmissão de dados em 69%. Os pesquisadores observam que a precisão permaneceu próxima aos resultados de métodos alternativos. Em outras palavras, uma certa qualidade pode ser perdida, mas os ganhos em velocidade e eficiência de recursos comprovam ser muito significativos.

A equipe testou separadamente a abordagem não apenas em simulação, mas também em uma pequena rede de dispositivos reais com poder computacional variável. Lá, o FTTE também demonstrou melhor escalabilidade com um número crescente de participantes e foi especialmente útil em ambientes com telefones fracos e conexões instáveis.

O próximo passo é estudar não apenas a qualidade média do modelo compartilhado, mas também como essa abordagem pode aprimorar a personalização em cada dispositivo individual. Os pesquisadores também querem realizar testes maiores em hardware real.

O que isso significa

Se os resultados forem confirmados fora do laboratório, o aprendizado federado se tornará significativamente mais prático para dispositivos convencionais. Para o mercado, este é um sinal importante: a IA privada pode ser implantada não apenas onde existem servidores poderosos e infraestrutura cara, mas também em ambientes mais pobres ou distribuídos, onde a proteção de dados é crítica e os recursos computacionais são limitados.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…