Anthropic considera Mythos perigosa demais: modelo encontrou falhas no software fundamental da internet
Anthropic não lançou Mythos ao acesso público após testes internos nos quais o modelo encontrou e encadeou vulnerabilidades complexas em navegadores, Linux e…
Processado por IA de Bloomberg Tech; editado por Hamidun News
A Anthropic criou o Mythos como um modelo de ponta universal, mas descobriu rapidamente que havia obtido não apenas mais um IA poderoso para código. Durante testes internos, o Mythos começou a encontrar e converter em exploits funcionais vulnerabilidades no próprio software fundamental no qual grande parte da infraestrutura computacional moderna repousa. Depois disso, a empresa decidiu não lançar o modelo em acesso aberto e o transferiu para modo fechado para um círculo limitado de parceiros.
O momento decisivo chegou durante verificações internas de segurança, quando o pesquisador da Anthropic Nicholas Carlini começou a testar deliberadamente o modelo em cenários maliciosos. O Mythos impressionou até pessoas que profissionalmente realizam testes de estresse para IA e cibersegurança. A equipe interna da Anthropic concluiu que o modelo é capaz de encontrar e explorar vulnerabilidades zero-day em todos os principais sistemas operacionais e em todos os principais navegadores.
É importante notar que o Mythos não foi criado como uma ferramenta cibernética especializada: suas capacidades perigosas, segundo a empresa, surgiram como efeito colateral do salto geral em programação, raciocínio e uso autônomo de ferramentas. Investigações posteriores revelaram que não se tratava de truques de demonstração. A Anthropic divulgou vários exemplos de problemas já corrigidos: uma vulnerabilidade de 27 anos no OpenBSD, um bug de 16 anos no FFmpeg que sistemas automatizados executaram milhões de vezes e nunca detectaram, bem como cadeias de vulnerabilidades no kernel do Linux que permitiam transição do acesso regular de usuário para controle completo da máquina.
Em um teste, o Mythos montou por si só um exploit de navegador a partir de quatro vulnerabilidades e conseguiu contornar vários níveis de isolamento simultaneamente. De acordo com o blog do time de segurança da Anthropic, mais de 99% dos problemas encontrados pelo modelo permaneciam desatualizados no momento da publicação, portanto a empresa não divulga detalhes técnicos e trabalha através de divulgação coordenada de vulnerabilidades. A resposta para isso foi o Project Glasswing, anunciado pela Anthropic em 7 de abril de 2026.
Em vez de um lançamento regular, a empresa abriu acesso apenas a participantes selecionados: entre os parceiros iniciais estão AWS, Apple, Google, Microsoft, NVIDIA, Cisco, CrowdStrike, Palo Alto Networks, Linux Foundation e JPMorganChase. Além deles, mais de 40 organizações responsáveis por software e infraestrutura críticos ganharam acesso. A Anthropic enfatiza separadamente que deseja dar aos defensores uma vantagem inicial: a empresa alocou até 100 milhões de dólares em créditos para usar o Mythos Preview e mais 4 milhões de dólares para apoiar a segurança de código aberto.
Um lançamento público para todos os usuários não está planejado no momento. A história não termina por aí, porque as consequências se estendem muito além de um laboratório. Bancos e agências governamentais começaram a avaliar urgentemente o que aconteceria se modelos dessa classe chegassem não apenas aos defensores, mas também a grupos criminosos ou hackers patrocinados pelo estado.
O setor financeiro está particularmente nervoso: se a janela entre a descoberta de vulnerabilidade e exploração encolher de semanas e meses para horas, os sistemas através dos quais passam pagamentos, liquidações e armazenamento de dados estarão sob fogo. É por isso que discussões em torno do Mythos surgiram rapidamente não apenas nas maiores empresas de tecnologia, mas também entre reguladores e grandes instituições financeiras. A principal conclusão aqui é que a indústria entrou em uma nova fase.
Até agora, o debate era principalmente sobre se modelos de linguagem poderiam ajudar a escrever código malicioso. A história do Mythos mostra um cenário mais duro: um modelo de ponta é capaz de procurar por fraquezas em bases de código complexas, montar cadeias de ataque funcionais a partir delas e fazer isso em uma escala indisponível para a maioria das equipes humanas. Para o mercado, isso significa uma mudança na lógica: a questão não é mais se lançar tais sistemas como um produto regular, mas se desenvolvedores, provedores de infraestrutura e governos conseguirão construir defesas antes que capacidades similares se tornem generalizadas.
A decisão da Anthropic de atrasar o lançamento parece não uma precaução de marketing, mas como um reconhecimento de que o limite entre IA útil para desenvolvimento e uma ferramenta de ofensiva cibernética se tornou muito mais fino.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.