Claude Fable 5 viveu três dias: vazamento de prompt de sistema, degradação e diretiva dos EUA
A Anthropic lançou o Claude Fable 5 em 9 de junho e retirou-o três dias depois. Durante esse período: o pesquisador Pliny publicou o suposto prompt de…
Processado por IA de Habr AI; editado por Hamidun News
A Anthropic lançou Claude Fable 5 e o Mythos 5 fechado em 9 de junho — e já no dia 12 retirou o acesso a ambas as versões. Dentro de três dias entre o lançamento e a retirada, aconteceu mais do que muitos modelos acumulam em um ano: comprometimento do prompt do sistema, degradação oculta das respostas, mudança na política de retenção de dados e uma diretiva do governo dos EUA.
Lançamento e revogação repentina
Fable 5 foi posicionado como um passo significativo na linha Claude: raciocínio aprimorado, seguimento de instruções mais preciso, análise contextual profunda. Mythos 5 — uma versão com capacidades expandidas — foi distribuído apenas em circuito fechado para parceiros selecionados. O lançamento simultâneo de duas versões — pública e fechada — foi em si uma manobra atípica: a Anthropic normalmente lança um modelo com expansão gradual de acesso.
Três dias após o lançamento, a empresa suspendeu o acesso a ambos os modelos sem explicação. A declaração oficial apenas confirmou o fato da suspensão, sem informar os motivos. Até mesmo revogações de emergência são normalmente acompanhadas por uma breve explicação pública — aqui não houve.
A ausência de comentários apenas intensificou ondas de discussão e especulação.
Comprometimento do prompt e degradação oculta
O pesquisador Pliny publicou uma postagem detalhada no X com o supostamente prompt do sistema do Fable 5 e colocou o arquivo completo no GitHub. Segundo ele, os mecanismos protetores do modelo foram contornados usando métodos de injeção de prompt em múltiplas etapas. A Anthropic nem confirmou nem negou oficialmente a autenticidade dos dados publicados, o que muitos interpretaram como consentimento tácito.
Em paralelo, a comunidade de IA descobriu um problema muito mais sério: a empresa supostamente degradou secretamente a qualidade das respostas para vários pesquisadores de IA. Isso se refere a uma prática na qual certas contas — provavelmente aquelas que testavam ativamente as proteções do modelo — recebiam respostas notavelmente piores do que usuários normais. Para uma comunidade envolvida na avaliação independente de sistemas de IA, este é um golpe sério: se um modelo deliberadamente se degrada para quem o verifica, nenhum benchmark externo pode ser considerado confiável.
"Se a
Anthropic pode deliberadamente degradar o modelo para usuários específicos, qualquer teste público perde confiança", escreveu um dos benchmarkers de IA.
A disputa sobre métodos de contorno de proteção ultrapassou o escopo acadêmico: várias equipes independentes publicaram demonstrações de cenários bem-sucedidos de jailbreak com Fable 5, o que intensificou a pressão sobre a empresa por explicações.
Dados, ferramentas e regulação
Em meio aos escândalos, a Anthropic atualizou silenciosamente sua política de privacidade: as conversas com Claude agora são armazenadas por até 30 dias por padrão em vez de um período mais curto. A mudança ocorreu sem anúncio oficial — observadores independentes notaram, e isso apenas adicionou crítica contra uma empresa já acusada de falta de transparência. No fronte do desenvolvimento, a Anthropic continuou avançando Claude Code durante o mesmo período. Entre as atualizações principais do kit de ferramentas:
- Suporte expandido para cadeias de agentes
- Novos tipos de hooks (CwdChanged, FileChanged, TaskCreated)
- Trabalho aprimorado com grandes monorepos
- Suporte para execução paralela de subagentes
- Interface atualizada de gerenciamento de permissões
Ao final do período, uma diretiva do governo dos EUA surgiu, afetando o uso de Claude em estruturas governamentais. Os detalhes do documento ainda não foram totalmente divulgados, mas o mero aparecimento de um ato regulatório mencionando um modelo comercial específico é raro. Este é um sinal: a supervisão de sistemas de IA poderosos está mudando de discussão para prática.
O que isso significa
Em três dias, a Anthropic viajou de um lançamento importante para uma retirada completa do modelo — com paradas no prompt do sistema comprometido, no escândalo de degradação de respostas e na mudança silenciosa dos termos de retenção de dados. Cada episódio individualmente é explicável, mas juntos formam um padrão de opacidade. Conforme as capacidades dos sistemas de IA crescem, reguladores e usuários exigirão maior clareza — a história do Fable 5 demonstra claramente o que resulta de sua ausência.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.