Habr AI→ original

Claude Fable 5 viveu três dias: vazamento de prompt de sistema, degradação e diretiva dos EUA

A Anthropic lançou o Claude Fable 5 em 9 de junho e retirou-o três dias depois. Durante esse período: o pesquisador Pliny publicou o suposto prompt de…

Processado por IA de Habr AI; editado por Hamidun News
Claude Fable 5 viveu três dias: vazamento de prompt de sistema, degradação e diretiva dos EUA
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

A Anthropic lançou Claude Fable 5 e o Mythos 5 fechado em 9 de junho — e já no dia 12 retirou o acesso a ambas as versões. Dentro de três dias entre o lançamento e a retirada, aconteceu mais do que muitos modelos acumulam em um ano: comprometimento do prompt do sistema, degradação oculta das respostas, mudança na política de retenção de dados e uma diretiva do governo dos EUA.

Lançamento e revogação repentina

Fable 5 foi posicionado como um passo significativo na linha Claude: raciocínio aprimorado, seguimento de instruções mais preciso, análise contextual profunda. Mythos 5 — uma versão com capacidades expandidas — foi distribuído apenas em circuito fechado para parceiros selecionados. O lançamento simultâneo de duas versões — pública e fechada — foi em si uma manobra atípica: a Anthropic normalmente lança um modelo com expansão gradual de acesso.

Três dias após o lançamento, a empresa suspendeu o acesso a ambos os modelos sem explicação. A declaração oficial apenas confirmou o fato da suspensão, sem informar os motivos. Até mesmo revogações de emergência são normalmente acompanhadas por uma breve explicação pública — aqui não houve.

A ausência de comentários apenas intensificou ondas de discussão e especulação.

Comprometimento do prompt e degradação oculta

O pesquisador Pliny publicou uma postagem detalhada no X com o supostamente prompt do sistema do Fable 5 e colocou o arquivo completo no GitHub. Segundo ele, os mecanismos protetores do modelo foram contornados usando métodos de injeção de prompt em múltiplas etapas. A Anthropic nem confirmou nem negou oficialmente a autenticidade dos dados publicados, o que muitos interpretaram como consentimento tácito.

Em paralelo, a comunidade de IA descobriu um problema muito mais sério: a empresa supostamente degradou secretamente a qualidade das respostas para vários pesquisadores de IA. Isso se refere a uma prática na qual certas contas — provavelmente aquelas que testavam ativamente as proteções do modelo — recebiam respostas notavelmente piores do que usuários normais. Para uma comunidade envolvida na avaliação independente de sistemas de IA, este é um golpe sério: se um modelo deliberadamente se degrada para quem o verifica, nenhum benchmark externo pode ser considerado confiável.

"Se a

Anthropic pode deliberadamente degradar o modelo para usuários específicos, qualquer teste público perde confiança", escreveu um dos benchmarkers de IA.

A disputa sobre métodos de contorno de proteção ultrapassou o escopo acadêmico: várias equipes independentes publicaram demonstrações de cenários bem-sucedidos de jailbreak com Fable 5, o que intensificou a pressão sobre a empresa por explicações.

Dados, ferramentas e regulação

Em meio aos escândalos, a Anthropic atualizou silenciosamente sua política de privacidade: as conversas com Claude agora são armazenadas por até 30 dias por padrão em vez de um período mais curto. A mudança ocorreu sem anúncio oficial — observadores independentes notaram, e isso apenas adicionou crítica contra uma empresa já acusada de falta de transparência. No fronte do desenvolvimento, a Anthropic continuou avançando Claude Code durante o mesmo período. Entre as atualizações principais do kit de ferramentas:

  • Suporte expandido para cadeias de agentes
  • Novos tipos de hooks (CwdChanged, FileChanged, TaskCreated)
  • Trabalho aprimorado com grandes monorepos
  • Suporte para execução paralela de subagentes
  • Interface atualizada de gerenciamento de permissões

Ao final do período, uma diretiva do governo dos EUA surgiu, afetando o uso de Claude em estruturas governamentais. Os detalhes do documento ainda não foram totalmente divulgados, mas o mero aparecimento de um ato regulatório mencionando um modelo comercial específico é raro. Este é um sinal: a supervisão de sistemas de IA poderosos está mudando de discussão para prática.

O que isso significa

Em três dias, a Anthropic viajou de um lançamento importante para uma retirada completa do modelo — com paradas no prompt do sistema comprometido, no escândalo de degradação de respostas e na mudança silenciosa dos termos de retenção de dados. Cada episódio individualmente é explicável, mas juntos formam um padrão de opacidade. Conforme as capacidades dos sistemas de IA crescem, reguladores e usuários exigirão maior clareza — a história do Fable 5 demonstra claramente o que resulta de sua ausência.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…