Wired→ original

Meta suspendeu a colaboração com a Mercor após vazamento de dados sobre o treinamento de modelos de AI

Alguns dos maiores laboratórios de AI investigam um incidente de segurança na fornecedora de dados Mercor, e a Meta já suspendeu a colaboração com a empresa…

Processado por IA de Wired; editado por Hamidun News
Meta suspendeu a colaboração com a Mercor após vazamento de dados sobre o treinamento de modelos de AI
Fonte: Wired. Colagem: Hamidun News.
◐ Ouvir artigo

Mercor, um fornecedor líder de dados para a indústria de IA, se viu no centro de um grave incidente de segurança. Vários grandes laboratórios de IA iniciaram investigações internas, e Meta — um dos principais clientes da empresa — anunciou a suspensão da cooperação. Dados confidenciais sobre métodos de treinamento de modelos de IA corriam risco: informação que empresas de tecnologia protegem cuidadosamente como seu principal ativo competitivo.

Mercor é uma plataforma que conecta empresas de IA com milhares de especialistas em rotulagem e anotação de dados em todo o mundo. São precisamente os dados rotulados — textos cuidadosamente selecionados, diálogos, imagens com marcas de qualidade — que formam a base para treinar modelos de linguagem modernos. Sem anotação de qualidade, nem GPT-4, nem Claude, nem Llama existiriam.

Mercor atendia os principais players da indústria e, ao longo de vários anos, tornou-se um dos fornecedores mais proeminentes neste segmento. A questão-chave do incidente é o que exatamente poderia ter sido exposto. Não se trata apenas de vazamento de banco de dados de clientes ou dados pessoais.

Instruções para anotadores, categorias de dados, esquemas de preferências — rótulos RLHF que treinam modelos para dar respostas desejadas — tudo isso revela indiretamente as decisões metodológicas de uma empresa específica. Desenvolver tais processos custa centenas de milhões de dólares e requer muitos anos de experiência acumulada. O comprometimento desses dados é comparável em valor a um vazamento de código-fonte.

Meta reagiu rápida e preventivamente — suspendeu o trabalho com Mercor até esclarecimento completo do incidente. Este é o protocolo padrão quando se suspeita de comprometimento da cadeia de suprimentos: continuar transmitindo dados sensíveis a um fornecedor com status de segurança desconhecido é um risco injustificado. Especialmente porque Meta investe dezenas de bilhões em seus próprios sistemas de IA, incluindo a família aberta de modelos Llama e assistente Meta AI.

Outros laboratórios de IA que trabalhavam com Mercor também estão conduzindo suas próprias revisões. Permanece incerto: o que exatamente foi comprometido, em que volume, e se o incidente resultou de ataque cibernético externo ou erro interno de segurança. Nem Mercor nem as empresas envolvidas divulgaram ainda detalhes técnicos do ocorrido.

O incidente expõe uma vulnerabilidade sistêmica na indústria de IA. A terceirização em massa da rotulagem de dados significa que na cadeia de produção de cada grande modelo de IA, dezenas e às vezes centenas de empresas intermediárias participam. Cada uma delas obtém acesso a fragmentos da metodologia confidencial de seus clientes.

Enquanto isso, não existem padrões de segurança unificados da indústria para tais fornecedores: sem auditorias obrigatórias, sem requisitos de criptografia, sem protocolos de notificação de incidentes. Para Mercor, essa é uma crise de reputação. O negócio da empresa é inteiramente baseado na confiança dos laboratórios de IA, e essa confiança agora está em questão.

Mesmo que a investigação mostre que o dano real tenha sido limitado, o mero fato do incidente e a reação pública de Meta mudarão a posição de negociação da empresa no mercado. Este incidente deveria acelerar discussões sobre padrões de segurança obrigatórios para fornecedores de dados. Metodologia de treinamento é uma arma competitiva-chave na corrida de IA.

Tratar fornecedores de dados como contratantes ordinários não é mais possível: o nível de inspeção e controle deve corresponder ao nível de acesso a informações confidenciais. A escala do incidente e a lista completa de empresas afetadas ainda não foram divulgadas. Detalhes da investigação se tornarão conhecidos nos próximos dias.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…