Habr AI→ original

Claude Fable 5 a vécu trois jours : fuite du prompt système, dégradation et directive des États-Unis

Anthropic a lancé Claude Fable 5 le 9 juin et l'a retiré trois jours plus tard. Pendant ce temps : le chercheur Pliny a publié le prétendu prompt système du…

Traité par IA depuis Habr AI ; édité par Hamidun News
Claude Fable 5 a vécu trois jours : fuite du prompt système, dégradation et directive des États-Unis
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

Anthropic a lancé Claude Fable 5 et le Mythos 5 fermé le 9 juin — et dès le 12, a retiré l'accès aux deux versions. En trois jours entre le lancement et le retrait, il s'est passé plus que ce que beaucoup de modèles accumulent en un an : compromission du prompt système, dégradation cachée des réponses, changement de politique de rétention des données et une directive du gouvernement américain.

Lancement et révocation soudaine

Fable 5 a été positionné comme une étape significative dans la gamme Claude : raisonnement amélioré, suivi plus précis des instructions, analyse contextuelle profonde. Mythos 5 — une version aux capacités élargies — a été distribué uniquement dans un circuit fermé aux partenaires sélectionnés. Le lancement simultané de deux versions — publique et fermée — était en soi un geste atypique : Anthropic lance normalement un modèle avec une expansion graduelle de l'accès.

Trois jours après le lancement, l'entreprise a suspendu l'accès aux deux modèles sans explication. Le communiqué officiel a simplement confirmé le fait de la suspension, sans donner de raisons. Même les révocations d'urgence s'accompagnent généralement d'une brève explication publique — ce n'était pas le cas ici.

L'absence de commentaires n'a fait qu'intensifier les vagues de discussions et de spéculations.

Compromission du prompt et dégradation cachée

Le chercheur Pliny a publié un message détaillé sur X avec le supposé prompt système de Fable 5 et a placé l'archive complète sur GitHub. Selon lui, les mécanismes de protection du modèle ont été contournés par des méthodes d'injection de prompt multi-étapes. Anthropic n'a ni confirmé ni officiellement nié l'authenticité des données publiées, ce que beaucoup ont interprété comme un consentement tacite.

En parallèle, la communauté IA a découvert un problème beaucoup plus grave : l'entreprise aurait secrètement dégradé la qualité des réponses pour un nombre de chercheurs en IA. Il s'agit d'une pratique par laquelle certains comptes — probablement ceux qui testaient activement les protections du modèle — recevaient des réponses notablement pires que les utilisateurs ordinaires. Pour une communauté engagée dans l'évaluation indépendante des systèmes d'IA, c'est un coup sérieux : si un modèle se dégrade délibérément pour ceux qui le vérifient, aucun benchmark externe ne peut être considéré comme fiable.

«

Si Anthropic peut délibérément dégrader le modèle pour des utilisateurs spécifiques, tout test public perd de la crédibilité », a écrit l'un des benchmarkers d'IA.

Le différend sur les méthodes de contournement des protections a dépassé le cadre académique : plusieurs équipes indépendantes ont publié des démonstrations de scénarios de jailbreak réussis avec Fable 5, ce qui a intensifié la pression sur l'entreprise pour obtenir des explications.

Données, outils et réglementation

Au milieu des scandales, Anthropic a discrètement mis à jour sa politique de confidentialité : les conversations avec Claude sont maintenant stockées jusqu'à 30 jours par défaut au lieu d'une période plus courte. Le changement s'est fait sans annonce officielle — des observateurs indépendants l'ont remarqué, et cela n'a fait qu'ajouter des critiques contre une entreprise déjà accusée de manque de transparence. Sur le front du développement, Anthropic a continué à faire progresser Claude Code au cours de la même période. Parmi les mises à jour clés de la boîte à outils :

  • Support étendu des chaînes d'agents
  • Nouveaux types de hooks (CwdChanged, FileChanged, TaskCreated)
  • Travail amélioré avec les grands monorepos
  • Support pour l'exécution parallèle des subagents
  • Interface mise à jour de gestion des autorisations

À la fin de la période, une directive du gouvernement américain a émergé, affectant l'utilisation de Claude dans les structures gouvernementales. Les détails du document n'ont pas encore été totalement divulgués, mais la simple apparition d'un acte réglementaire mentionnant un modèle commercial spécifique est rare. C'est un signal : la surveillance des puissants systèmes d'IA passe de la discussion à la pratique.

Ce que cela signifie

En trois jours, Anthropic a parcouru le chemin d'un lancement majeur à un retrait complet du modèle — avec des haltes au prompt système compromis, au scandale de dégradation des réponses et aux modifications discrètes des conditions de rétention des données. Chaque épisode pris individuellement est explicable, mais ensemble ils forment un schéma d'opacité. À mesure que les capacités des systèmes d'IA croissent, les régulateurs et les utilisateurs exigeront plus de clarté — l'histoire de Fable 5 démontre clairement les conséquences de son absence.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…