Reivindicações da Anthropic sobre descoberta de vulnerabilidades via Mythos questionadas pela indústria de cibersegurança
Uma disputa eclodiu em torno das capacidades cibernéticas do Anthropic Mythos. O modelo que alarmou agências governamentais e grandes organizações pela sua…
Processado por IA de Bloomberg Tech; editado por Hamidun News
Ao redor do Mythos da Anthropic, não apenas interesse, mas também ceticismo está se formando rapidamente: o modelo que está sendo discutido pela sua capacidade de encontrar vulnerabilidades cibernéticas perigosas pode não ser tão único quanto parece na apresentação pública. Se os resultados dos testes internos da Aisle estão corretos, o caso de alto impacto que causou alarme entre agências governamentais e grandes organizações está sendo replicado em modelos de código aberto muito mais baratos. A discussão foi provocada por reivindicações de que o Mythos pode identificar defeitos de software e vulnerabilidades em um nível que levou agências governamentais e clientes institucionais a levarem os riscos de tal ferramenta mais a sério.
O simples fato de que o modelo está sendo testado apenas por um conjunto limitado de empresas apenas aumenta a tensão: quando o acesso ao sistema é fechado, o mercado é forçado a confiar não em um benchmark amplo, mas em demonstrações individuais e avaliações do desenvolvedor. É aqui que a crítica-chave foi feita por Jaya Balu, COO e CISO da empresa de cibersegurança Aisle. De acordo com ela, nos testes internos a equipe conseguiu reproduzir o mesmo resultado que a Anthropic citou usando modelos de código aberto baratos.
Em outras palavras, isto pode não ser sobre um salto tecnológico inatingível de um sistema fechado, mas sobre uma tarefa que ferramentas mais acessíveis já conseguem resolver com configuração adequada, contexto suficiente e prompts bem formulados. Para compradores e reguladores, a distinção aqui é enorme. Uma coisa é um modelo raro com acesso rigidamente controlado que mostra resultados inusitados em um circuito fechado.
Outra é uma situação onde efeitos comparáveis são demonstrados por sistemas mais baratos disponíveis para implantação interna ou trabalho com código aberto. No primeiro caso, a ênfase está em restringir o acesso a um produto específico. No segundo caso, está no fato de que as organizações terão que revisar seus processos de proteção, revisão de código e testes internos como parte de uma nova norma.
Há também outra camada importante nesta história: a questão da confiança em reivindicações sensacionalistas em um estágio inicial de testes. Enquanto o modelo passa por testes de um círculo limitado de empresas, o mercado público vê apenas a ponta do iceberg—um caso individual, uma formulação impressionante e a reação a ela. Mas para uma avaliação real, são necessários cenários comparáveis, resultados repetíveis e uma compreensão das condições sob as quais o modelo encontrou uma vulnerabilidade específica.
Sem isso, é fácil confundir uma demonstração impressionante com uma vantagem sustentável. Para a indústria de cibersegurança, este é um momento fundamental. Se a singularidade do Mythos está sendo exagerada, a avaliação da ameaça também muda.
As preocupações sobre tais modelos são construídas em duas premissas: eles aceleram a busca por vulnerabilidades e reduzem a barreira de entrada para atacantes. Mas se o mesmo efeito é alcançável através do ecossistema de código aberto, a discussão deveria mudar de uma empresa específica para um fato mais amplo: essas capacidades provavelmente já estão distribuídas pelo mercado e não estão vinculadas a um único fornecedor. Por outro lado, isso não enfraquece necessariamente a preocupação—ao contrário, a torna mais prática.
Para agências governamentais, corporações e desenvolvedores, a questão agora não é apenas sobre quão poderosa é uma IA líder, mas também sobre quão rapidamente funções semelhantes se espalham para modelos de baixo custo e amplamente disponíveis. O acesso fechado ao Mythos poderia ter criado uma impressão de perigo exclusivo. A declaração da Aisle aponta para um cenário diferente: a capacidade de encontrar bugs, útil para defensores e igualmente arriscada nas mãos de atacantes, já está se tornando generalizada.
A conclusão principal é que a disputa em torno do Mythos da Anthropic é uma disputa não apenas sobre a qualidade de um modelo, mas também sobre como o mercado mede a singularidade da IA em cibersegurança. Se soluções baratas de código aberto realmente encontram as mesmas vulnerabilidades, a vantagem competitiva da Anthropic parece menos dramática, e a própria discussão transita do reino da sensação para verificação, testes comparativos e controle de acesso para tais ferramentas.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.