Wired→ original

Meta suspendió su colaboración con Mercor tras una filtración de datos sobre el entrenamiento de modelos de AI

Varios de los mayores laboratorios de AI investigan un incidente de seguridad en el proveedor de datos Mercor, y Meta ya suspendió la colaboración con la…

Procesado por IA desde Wired; editado por Hamidun News
Meta suspendió su colaboración con Mercor tras una filtración de datos sobre el entrenamiento de modelos de AI
Fuente: Wired. Collage: Hamidun News.
◐ Escuchar artículo

Mercor, un proveedor líder de datos para la industria de IA, se vio en el centro de un grave incidente de seguridad. Varios grandes laboratorios de IA iniciaron investigaciones internas, y Meta — uno de los principales clientes de la empresa — anunció la suspensión de la cooperación. Corrían riesgo datos confidenciales sobre métodos de entrenamiento de modelos de IA: información que las empresas tecnológicas protegen cuidadosamente como su principal activo competitivo.

Mercor es una plataforma que conecta empresas de IA con miles de especialistas en etiquetado y anotación de datos en todo el mundo. Son precisamente los datos etiquetados — textos cuidadosamente seleccionados, diálogos, imágenes con marcas de calidad — los que forman la base para el entrenamiento de modelos de lenguaje modernos. Sin anotación de calidad, ni GPT-4, ni Claude, ni Llama existirían.

Mercor servía a los principales actores de la industria y en varios años se convirtió en uno de los proveedores más prominentes de este segmento. La pregunta clave del incidente es qué exactamente podría haber sido expuesto. No se trata simplemente de una fuga de base de datos de clientes o datos personales.

Las instrucciones para anotadores, las categorías de datos, los esquemas de preferencias — las etiquetas RLHF que entrenan a los modelos para dar respuestas deseadas — todo esto revela indirectamente las decisiones metodológicas de una empresa en particular. Desarrollar tales procesos cuesta cientos de millones de dólares y requiere muchos años de experiencia acumulada. El compromiso de estos datos es comparable en valor a una fuga de código fuente.

Meta reaccionó rápida y preventivamente — suspendió el trabajo con Mercor hasta la aclaración completa del incidente. Este es el protocolo estándar cuando se sospecha el compromiso de la cadeia de suministro: continuar transmitiendo datos sensibles a un proveedor con estatus de seguridad desconocido es un riesgo injustificado. Especialmente porque Meta invierte decenas de miles de millones en sus propios sistemas de IA, incluyendo la familia abierta de modelos Llama y el asistente Meta AI.

Otros laboratorios de IA que trabajaban con Mercor también están realizando sus propias revisiones. Sigue siendo incierto: qué exactamente fue comprometido, en qué volumen, y si el incidente resultó de un ataque cibernético externo o de un error interno de seguridad. Ni Mercor ni las empresas involucradas han divulgado aún los detalles técnicos de lo ocurrido.

El incidente expone una vulnerabilidad sistémica en la industria de IA. La externalización masiva del etiquetado de datos significa que en la cadeia de producción de cada gran modelo de IA participan docenas, a veces cientos de empresas intermediarias. Cada una de ellas obtiene acceso a fragmentos de la metodología confidencial de sus clientes.

Mientras tanto, no hay estándares de seguridad unificados de la industria para tales proveedores: sin auditorías obligatorias, sin requisitos de encriptación, sin protocolos de notificación de incidentes. Para Mercor, esta es una crisis de reputación. El negocio de la empresa se basa enteramente en la confianza de los laboratorios de IA, y esa confianza ahora está en cuestión.

Incluso si la investigación muestra que el daño real fue limitado, el mero hecho del incidente y la reacción pública de Meta cambiarán la posición negociadora de la empresa en el mercado. Este incidente debería acelerar las discusiones sobre estándares de seguridad obligatorios para proveedores de datos. La metodología de entrenamiento es un arma competitiva clave en la carrera de IA.

Tratar a los proveedores de datos como contratistas ordinarios ya no es posible: el nivel de inspección y control debe corresponder al nivel de acceso a información confidencial. La escala del incidente y la lista completa de empresas afectadas aún no han sido divulgadas. Los detalles de la investigación se conocerán en los próximos días.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…