Anthropic apresenta Claude Mythos 5 e Fable 5 com proteção contra ciberataques
Anthropic lançou duas versões do Claude: Mythos 5 para parceiros confiáveis e Fable 5 para o público em geral. O Fable 5 vem com proteção integrada contra…
Processado por IA de Wired; editado por Hamidun News
Anthropic apresentou duas novas versões do Claude: Mythos 5 para organizações confiáveis e Fable 5 para o público em geral. A segunda versão foi desenvolvida especialmente com mecanismos que dificultam seu uso em ciberataques.
Divisão por propósito
Anthropicestá seguindo o caminho de dividir seus modelos de IA dependendo do público-alvo e dos riscos potenciais. Claude Mythos 5 é destinado a parceiros confiáveis, incluindo empresas na área de cibersegurança, organizações de pesquisa e clientes corporativos que precisam de todas as capacidades do modelo de linguagem sem limitações. Claude Fable 5 é lançado em acesso aberto para o público em geral. A empresa incorporou limitações especiais nesta versão, destinadas a prevenir o uso do modelo em ataques cibernéticos e outros fins maliciosos. Esta é uma estratégia que permite à Anthropic oferecer uma ferramenta de IA poderosa, mas minimiza a responsabilidade direta por seu uso potencial indevido.
Proteção incorporada na arquitetura
A diferença-chave do Fable 5 é que o mecanismo de proteção não se baseia simplesmente em instruções ou restrições no nível da API (que são fáceis de contornar), mas em mudanças na arquitetura e no processo de treinamento do próprio modelo. Anthropic acredita que essa abordagem é mais confiável e duradoura do que os sistemas de controle no nível de aplicação.
- Limitações integradas no processo de treinamento do modelo
- Mudanças arquitetônicas que impedem certas classes de tarefas
- Acessibilidade pública sem barreiras de licença, mas com limitações
Ao contrário de um simples filtro que captura solicitações maliciosas em tempo real, as limitações integradas alteram o comportamento do modelo em nível fundamental. Isso significa que mesmo com tentativas de contorno, o sistema será menos útil para ciberataques.
Pressão crescente na indústria
A solução da Anthropic reflete a pressão crescente de reguladores, políticos e do público, que exigem que as empresas de IA assumam responsabilidade pelo dano potencial. Diante dos debates sobre a possibilidade de usar grandes modelos de linguagem em ciberataques, o lançamento de uma versão "segura" parece um movimento estratégico. Outras empresas, incluindo OpenAI e Google, também estão sob pressão e desenvolvem suas próprias abordagens de controle. No entanto, ainda não há um padrão único na indústria. A abordagem da Anthropic com divisão de dois níveis parece pragmática: dar aos parceiros confiáveis acesso total, enquanto oferece ao público uma versão limitada, mas segura.
O que isso significa
Anthropic demonstra que a segurança de IA está começando a ser vista como uma linha de produtos separada, não como um módulo adicional. Isso pode se tornar uma tendência na indústria: em vez de um modelo para todos, as empresas oferecerão várias versões com diferentes níveis de restrições. No entanto, permanecem questões sobre a eficácia prática das limitações integradas e se os usuários aceitarão restrições em troca da promessa de segurança.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.