MIT News→ original

MIT Acelera el Entrenamiento Privado de IA en Dispositivos Ordinarios para Medicina y Finanzas

MIT presentó el método FTTE, que acelera el aprendizaje federado de IA en smartphones, sensores y smartwatches sin enviar datos brutos a la nube. En pruebas…

Procesado por IA desde MIT News; editado por Hamidun News
MIT Acelera el Entrenamiento Privado de IA en Dispositivos Ordinarios para Medicina y Finanzas
Fuente: MIT News. Collage: Hamidun News.
◐ Escuchar artículo

Investigadores del MIT han demostrado una manera de acelerar significativamente el aprendizaje federado — un enfoque en el que la IA se refina directamente en los dispositivos de los usuarios, y los datos sin procesar nunca abandonan el smartphone, smartwatch o sensor. El nuevo método debería ayudar a desplegar modelos más precisos en salud, finanzas y otros escenarios sensibles, incluso donde los dispositivos son menos potentes y la conectividad es inestable.

Por qué la red se ralentiza

El aprendizaje federado ha sido durante mucho tiempo considerado uno de los enfoques más prácticos para entrenar modelos sin recopilación centralizada de datos personales. Un servidor distribuye un modelo común a muchos dispositivos, cada uno lo refina con sus datos locales, y luego devuelve solo actualizaciones de parámetros. De esta manera, la información de teléfonos, smartwatches y sensores se puede utilizar sin cargar los datos en la nube.

El problema es que una red real de estos dispositivos casi nunca es uniforme: algunos tienen memoria limitada, otros tienen procesadores débiles y otros más tienen conexiones inestables. Por eso, el esquema clásico comienza a fallar. Normalmente, el servidor central espera actualizaciones de todos los participantes en una ronda antes de continuar. Si algunos dispositivos responden demasiado lentamente, todo el proceso se arrastra y a veces se vuelve impracticable. Para escenarios del mundo real, esto es un obstáculo serio: en salud, banca y otros campos sensibles, tanto la privacidad como la estabilidad son importantes, pero precisamente esas son las áreas donde a menudo está disponible una infraestructura limitada.

Cómo funciona FTTE

El equipo del MIT propuso un framework FTTE — Federated Tiny Training Engine. Su objetivo es simple: permitir que incluso los dispositivos más débiles participen en el entrenamiento sin romper todo el sistema a través de retrasos y transferencias innecesarias de datos. El enfoque se construye alrededor de tres cambios técnicos y un principio general: adaptar el proceso no para un smartphone ideal, sino para el nodo más restringido de la red.

  • El servidor envía a los dispositivos no el modelo completo, sino solo una parte de los parámetros suficientes para un paso de entrenamiento local.
  • El conjunto de parámetros se selecciona usando un procedimiento de búsqueda especial para ajustarse al límite de memoria del dispositivo más débil.
  • Las actualizaciones se aceptan de forma semi-asíncrona: el servidor no espera a todos los participantes sino que continúa la ronda una vez que se recopilan suficientes respuestas.
  • Las actualizaciones más antiguas reciben menos peso para que los datos retrasados no ralenticen el entrenamiento y no degraden la precisión final.
"Necesitamos que la IA funcione en dispositivos que las personas llevan consigo todos los días, no solo en servidores grandes y GPUs", explica la investigadora

Irene Tenison.

Este diseño aborda dos puntos de dolor a la vez: escasez de memoria en el dispositivo en sí y retrasos innecesarios del lado del servidor. En lugar de excluir dispositivos lentos del proceso, los desarrolladores intentan mantenerlos en el ciclo para que el modelo aprenda de datos más diversos. Esto es especialmente importante en áreas donde los usuarios no tienen teléfonos insignia y conectividad cara, pero sí tienen datos que pueden mejorar la calidad del modelo.

Qué mostraron las pruebas

En simulaciones con cientos de dispositivos heterogéneos, FTTE aceleró significativamente el entrenamiento en comparación con los enfoques estándar de aprendizaje federado. En promedio, el sistema completó el entrenamiento 81% más rápido, redujo los costos de memoria local aproximadamente un 80% y disminuyó el volumen de transmisión de datos en un 69%. Los investigadores señalan que la precisión se mantuvo cercana a los resultados de métodos alternativos. En otras palabras, se puede perder algo de calidad, pero las ganancias en velocidad y eficiencia de recursos resultan ser muy significativas.

El equipo probó por separado el enfoque no solo en simulación sino también en una pequeña red de dispositivos reales con potencia computacional variable. Allí, FTTE también demostró mejor escalabilidad con un número creciente de participantes y fue especialmente útil en entornos con teléfonos débiles y conexiones inestables.

El siguiente paso es estudiar no solo la calidad promedio del modelo compartido, sino también cómo este enfoque puede mejorar la personalización en cada dispositivo individual. Los investigadores también quieren realizar pruebas más grandes en hardware real.

Qué significa esto

Si los resultados se confirman fuera del laboratorio, el aprendizaje federado se volverá significativamente más práctico para dispositivos convencionales. Para el mercado, esta es una señal importante: la IA privada se puede implementar no solo donde existen servidores potentes e infraestructura cara, sino también en entornos más pobres o distribuidos, donde la protección de datos es crítica y los recursos computacionales son limitados.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…