Anthropic acusa DeepSeek e MiniMax de roubar conhecimento de seus modelos
A Anthropic acusou publicamente três empresas chinesas — DeepSeek, MiniMax e outra desenvolvedora de AI não identificada — de "extrair ilegalmente" saídas…
Processado por IA de Bloomberg Tech; editado por Hamidun News
Anthropic, criadora da família de modelos Claude e um dos principais jogadores na corrida pela liderança em inteligência artificial, fez uma declaração severa: segundo seus dados, pelo menos três grandes desenvolvedoras de IA chinesas estão sistematicamente "extraindo" os resultados dos seus modelos para utilizá-los no treinamento e aprimoramento de seus próprios produtos. Entre as empresas nomeadas estão DeepSeek e MiniMax, dois dos mais notáveis startups chineses do momento. O nome do terceiro desenvolvedor ainda não foi revelado.
Trata-se de uma prática conhecida na indústria como destilação. Sua essência é simples: em vez de gastar centenas de milhões de dólares treinando um modelo do zero em enormes conjuntos de dados, você pode usar um modelo já poderoso como "professor". Você envia consultas para ele, coleta as respostas e então treina seu próprio modelo—tipicamente mais compacto—nesses pares "pergunta-resposta". O resultado é um sistema que reproduz uma parcela significativa das capacidades do original com custos substancialmente menores. Tecnicamente, isto não é copiar pesos de redes neurais nem invadir servidores, mas a Anthropic qualifica tais ações como violações de seus termos de serviço e as chama de "extração ilegal".
Compreender essa declaração requer contexto sobre a ascensão meteórica do DeepSeek, que no último ano transformou-se de um startup obscuro em um dos jogadores mais discutidos da indústria global de IA. Os modelos do DeepSeek demonstraram resultados de benchmark impressionantes comparáveis aos dos principais sistemas ocidentais, enquanto a empresa se posiciona como desenvolvedora que alcança eficiência com significativamente menos recursos computacionais. MiniMax, por sua vez, atraiu atenção de investidores e usuários através de capacidades multimodais e uma estratégia agressiva de entrada no mercado internacional. Os sucessos de ambas as empresas levantaram questões entre concorrentes ocidentais: como conseguem alcançar tais resultados sob rígidas restrições de exportação de chips avançados impostas pela administração dos EUA?
A declaração da Anthropic fornece uma possível resposta—e essa resposta é extremamente incômoda para toda a indústria. A destilação como método não é nada novo ou secreto. Ela é ativamente utilizada dentro das próprias empresas ocidentais: é exatamente assim que são criadas versões leves de modelos—aquelas variantes "mini" e "lite" que rodam em smartphones e servidores de baixa potência.
O problema surge quando a destilação é conduzida não pelo proprietário do modelo, mas por um concorrente, essencialmente parasitando o investimento de outro em pesquisa e computação. A Anthropic, por várias estimativas, gastou bilhões de dólares treinando seus modelos—e se uma parcela significativa desse conhecimento pode ser "derramada" em um produto concorrente através de uma API por quantias relativamente modestas, isso questiona o próprio modelo econômico do desenvolvimento de sistemas de IA de fronteira.
Para reguladores e políticos americanos, essa declaração servirá como mais um argumento a favor do aperto do controle. Já agora, projetos de lei estão sendo discutidos no Congresso que poderiam limitar o acesso a modelos avançados de IA via API para usuários de certas jurisdições. A administração está ativamente expandindo controles de exportação, estendendo-os não apenas a chips, mas a software e até aos pesos dos modelos. As acusações da Anthropic acrescentam um caso concreto a essa discussão, facilmente transformável em uma narrativa política sobre "roubo de tecnologia americana".
Porém, a situação está longe de ser simples. Empresas chinesas certamente contestarão as acusações, e o lado legal da questão permanece nebuloso. Os termos de serviço da API constituem um contrato, não uma lei, e sua violação resulta em suspensão de conta, não em perseguição criminal. Além disso, traçar uma linha clara entre "destilação" e "inspiração nos resultados" é tecnicamente extremamente difícil. Se um pesquisador lê as respostas do Claude e, baseado na compreensão obtida, melhora a arquitetura de seu próprio modelo—isso também é destilação? A indústria precisará desenvolver um consenso sobre esta questão, e até que o faça, tais acusações permanecerão em uma zona cinzenta.
O que é verdadeiramente importante nessa história é que ela expõe uma contradição fundamental da era. Empresas como a Anthropic simultaneamente desejam a distribuição mais ampla possível de seus modelos (isso gera receita e fortalece o ecossistema) e controle sobre exatamente como os resultados desses modelos são utilizados. Esses dois desejos são cada vez mais difíceis de conciliar. Toda API aberta é um potencial canal para vazamento de conhecimento. E enquanto não surgirem mecanismos confiáveis de proteção técnica ou legal, a corrida pela liderança em IA será acompanhada por conflitos cada vez mais agudos entre aqueles que criam modelos e aqueles que encontram formas de extrair o máximo deles—sem pedir permissão.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.