Meta suspendeu a colaboração com a Mercor após vazamento de dados sobre o treinamento de modelos de AI
Alguns dos maiores laboratórios de AI investigam um incidente de segurança na fornecedora de dados Mercor, e a Meta já suspendeu a colaboração com a empresa…
Processado por IA de Wired; editado por Hamidun News
Mercor, um fornecedor líder de dados para a indústria de IA, se viu no centro de um grave incidente de segurança. Vários grandes laboratórios de IA iniciaram investigações internas, e Meta — um dos principais clientes da empresa — anunciou a suspensão da cooperação. Dados confidenciais sobre métodos de treinamento de modelos de IA corriam risco: informação que empresas de tecnologia protegem cuidadosamente como seu principal ativo competitivo.
Mercor é uma plataforma que conecta empresas de IA com milhares de especialistas em rotulagem e anotação de dados em todo o mundo. São precisamente os dados rotulados — textos cuidadosamente selecionados, diálogos, imagens com marcas de qualidade — que formam a base para treinar modelos de linguagem modernos. Sem anotação de qualidade, nem GPT-4, nem Claude, nem Llama existiriam.
Mercor atendia os principais players da indústria e, ao longo de vários anos, tornou-se um dos fornecedores mais proeminentes neste segmento. A questão-chave do incidente é o que exatamente poderia ter sido exposto. Não se trata apenas de vazamento de banco de dados de clientes ou dados pessoais.
Instruções para anotadores, categorias de dados, esquemas de preferências — rótulos RLHF que treinam modelos para dar respostas desejadas — tudo isso revela indiretamente as decisões metodológicas de uma empresa específica. Desenvolver tais processos custa centenas de milhões de dólares e requer muitos anos de experiência acumulada. O comprometimento desses dados é comparável em valor a um vazamento de código-fonte.
Meta reagiu rápida e preventivamente — suspendeu o trabalho com Mercor até esclarecimento completo do incidente. Este é o protocolo padrão quando se suspeita de comprometimento da cadeia de suprimentos: continuar transmitindo dados sensíveis a um fornecedor com status de segurança desconhecido é um risco injustificado. Especialmente porque Meta investe dezenas de bilhões em seus próprios sistemas de IA, incluindo a família aberta de modelos Llama e assistente Meta AI.
Outros laboratórios de IA que trabalhavam com Mercor também estão conduzindo suas próprias revisões. Permanece incerto: o que exatamente foi comprometido, em que volume, e se o incidente resultou de ataque cibernético externo ou erro interno de segurança. Nem Mercor nem as empresas envolvidas divulgaram ainda detalhes técnicos do ocorrido.
O incidente expõe uma vulnerabilidade sistêmica na indústria de IA. A terceirização em massa da rotulagem de dados significa que na cadeia de produção de cada grande modelo de IA, dezenas e às vezes centenas de empresas intermediárias participam. Cada uma delas obtém acesso a fragmentos da metodologia confidencial de seus clientes.
Enquanto isso, não existem padrões de segurança unificados da indústria para tais fornecedores: sem auditorias obrigatórias, sem requisitos de criptografia, sem protocolos de notificação de incidentes. Para Mercor, essa é uma crise de reputação. O negócio da empresa é inteiramente baseado na confiança dos laboratórios de IA, e essa confiança agora está em questão.
Mesmo que a investigação mostre que o dano real tenha sido limitado, o mero fato do incidente e a reação pública de Meta mudarão a posição de negociação da empresa no mercado. Este incidente deveria acelerar discussões sobre padrões de segurança obrigatórios para fornecedores de dados. Metodologia de treinamento é uma arma competitiva-chave na corrida de IA.
Tratar fornecedores de dados como contratantes ordinários não é mais possível: o nível de inspeção e controle deve corresponder ao nível de acesso a informações confidenciais. A escala do incidente e a lista completa de empresas afetadas ainda não foram divulgadas. Detalhes da investigação se tornarão conhecidos nos próximos dias.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.