Wired→ original

Anthropic apresenta Claude Mythos 5 e Fable 5 com proteção contra ciberataques

Anthropic lançou duas versões do Claude: Mythos 5 para parceiros confiáveis e Fable 5 para o público em geral. O Fable 5 vem com proteção integrada contra…

Processado por IA de Wired; editado por Hamidun News
Anthropic apresenta Claude Mythos 5 e Fable 5 com proteção contra ciberataques
Fonte: Wired. Colagem: Hamidun News.
◐ Ouvir artigo

Anthropic apresentou duas novas versões do Claude: Mythos 5 para organizações confiáveis e Fable 5 para o público em geral. A segunda versão foi desenvolvida especialmente com mecanismos que dificultam seu uso em ciberataques.

Divisão por propósito

Anthropicestá seguindo o caminho de dividir seus modelos de IA dependendo do público-alvo e dos riscos potenciais. Claude Mythos 5 é destinado a parceiros confiáveis, incluindo empresas na área de cibersegurança, organizações de pesquisa e clientes corporativos que precisam de todas as capacidades do modelo de linguagem sem limitações. Claude Fable 5 é lançado em acesso aberto para o público em geral. A empresa incorporou limitações especiais nesta versão, destinadas a prevenir o uso do modelo em ataques cibernéticos e outros fins maliciosos. Esta é uma estratégia que permite à Anthropic oferecer uma ferramenta de IA poderosa, mas minimiza a responsabilidade direta por seu uso potencial indevido.

Proteção incorporada na arquitetura

A diferença-chave do Fable 5 é que o mecanismo de proteção não se baseia simplesmente em instruções ou restrições no nível da API (que são fáceis de contornar), mas em mudanças na arquitetura e no processo de treinamento do próprio modelo. Anthropic acredita que essa abordagem é mais confiável e duradoura do que os sistemas de controle no nível de aplicação.

  • Limitações integradas no processo de treinamento do modelo
  • Mudanças arquitetônicas que impedem certas classes de tarefas
  • Acessibilidade pública sem barreiras de licença, mas com limitações

Ao contrário de um simples filtro que captura solicitações maliciosas em tempo real, as limitações integradas alteram o comportamento do modelo em nível fundamental. Isso significa que mesmo com tentativas de contorno, o sistema será menos útil para ciberataques.

Pressão crescente na indústria

A solução da Anthropic reflete a pressão crescente de reguladores, políticos e do público, que exigem que as empresas de IA assumam responsabilidade pelo dano potencial. Diante dos debates sobre a possibilidade de usar grandes modelos de linguagem em ciberataques, o lançamento de uma versão "segura" parece um movimento estratégico. Outras empresas, incluindo OpenAI e Google, também estão sob pressão e desenvolvem suas próprias abordagens de controle. No entanto, ainda não há um padrão único na indústria. A abordagem da Anthropic com divisão de dois níveis parece pragmática: dar aos parceiros confiáveis acesso total, enquanto oferece ao público uma versão limitada, mas segura.

O que isso significa

Anthropic demonstra que a segurança de IA está começando a ser vista como uma linha de produtos separada, não como um módulo adicional. Isso pode se tornar uma tendência na indústria: em vez de um modelo para todos, as empresas oferecerão várias versões com diferentes níveis de restrições. No entanto, permanecem questões sobre a eficácia prática das limitações integradas e se os usuários aceitarão restrições em troca da promessa de segurança.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…