Anthropic: Claude Mythos Preview encontrou milhares de vulnerabilidades críticas em código
Anthropic apresentou Claude Mythos Preview como uma nova classe de ferramenta para descobrir bugs em código. De acordo com a empresa, o modelo já identificou…
Processado por IA de IEEE Spectrum AI; editado por Hamidun News
A Anthropic demonstrou como a segurança cibernética está mudando rapidamente na era da IA generativa: seu modelo Claude Mythos Preview conseguiu identificar milhares de vulnerabilidades de nível alto e crítico, incluindo problemas em sistemas operacionais populares, navegadores e bibliotecas criptográficas. Mas a conclusão principal não é que a IA aprendeu a encontrar bugs melhor. As mesmas capacidades que ajudam a identificar fraquezas no código também podem ser usadas para explorá-las, então a automação de segurança agora requer não apenas velocidade, mas também novas regras de controle.
No início de abril, o Frontier Red Team dentro da Anthropic informou que o Mythos Preview descobriu numerosos problemas graves, mesmo que o modelo não tenha sido especificamente treinado para buscar tais vulnerabilidades. De acordo com a empresa, entre os achados há defeitos em praticamente todos os principais sistemas operacionais e navegadores principais. Os exemplos citados incluem um bug de 27 anos no OpenBSD que permite comprometimento remoto de máquinas, uma vulnerabilidade em navegador através da qual um atacante pode ler dados de outro domínio, e fraquezas em bibliotecas criptográficas que poderiam levar à descriptografia de tráfego protegido ou falsificação de certificados.
Diante desses resultados, a Anthropic lançou o Project Glasswing. O projeto envolve Amazon Web Services, Apple, Google, Microsoft e Nvidia, e a tarefa da parceria é direta: usar Mythos Preview para escanear software e fortalecer sua proteção. A lógica é clara.
Se grandes modelos de linguagem já são capazes de analisar bases de código massivas, rastrear fluxo de dados entre componentes e notar conexões não triviais entre erros, então se tornam mais do que apenas outra ferramenta de análise estática—tornam-se um instrumento que de certa forma começa a se aproximar do trabalho de um pesquisador de segurança vivo. Isso também é observado por profissionais da indústria. Eles apontam que o ponto forte de tais modelos não é apenas velocidade, embora isso importe em si, mas a capacidade de raciocinar sobre semântica de código.
Ferramentas tradicionais com regras rígidas buscam principalmente correspondências de padrão contra modelos predeterminados, enquanto sistemas LLM modernos podem rastrear como dados fluem através de diferentes níveis de abstração e detectar um problema que surge apenas na junção de vários componentes. Para repositórios grandes, isso é particularmente importante: um agente de IA pode mais facilmente encontrar uma agulha rara mas perigosa em um vasto palheiro de código. No entanto, essa abordagem tem um lado negativo.
Modelos ainda produzem falsos positivos, podem classificar incorretamente um bug como vulnerabilidade ou exagerar a gravidade de um problema. Para mantenedores de projetos open source, isso se torna um ônus adicional: o número de relatórios cresce, e o tempo para revisar cada sinal aumenta. Outro risco é que ferramentas de IA não podem apenas ser atacadas—por exemplo, através de prompt injection—mas também serem usadas como mecanismo ofensivo.
O mesmo Mythos Preview, é afirmado, pode ligar múltiplos defeitos separados em uma cadeia de exploração passo a passo que ultimamente concede acesso de nível raiz ao kernel Linux. É por isso que especialistas falam não de substituição completa de humanos, mas de um esquema de verificação multicamadas. Uma abordagem já usada na indústria é a adversarial self review: o modelo primeiro encontra um problema, depois tenta desafiar sua própria conclusão ou passa o achado para outro modelo para validação independente.
Essa camada adicional ajuda a reduzir ruído, mas não elimina revisão manual. Conclusões de IA permanecem probabilísticas, o que significa que a decisão final deve ser tomada por um especialista que compreende a lógica de negócio do produto, arquitetura do sistema e cenários reais de exploração. Empresas também são aconselhadas a desenvolver modelagem de ameaças dinâmica, red teaming, e deslocar segurança para o início do processo de desenvolvimento, para que os desenvolvedores eliminem pontos fracos enquanto escrevem código, em vez de após lançamento.
A questão principal agora não é nem mesmo se a IA pode encontrar vulnerabilidades melhor e mais rápido que humanos, mas como integrá-la em um fluxo de trabalho seguro. A próxima fronteira para tais sistemas não é apenas detecção mas também remediação em larga escala de problemas encontrados. Se esse estágio puder ser automatizado sem perda de qualidade e sem abandono de controle humano, o desenvolvimento de software seguro acelerará notavelmente.
Se não, a indústria terá outra ferramenta poderosa mas barulhenta que cria tanto trabalho quanto economiza.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.