Anthropic a jugé Mythos trop dangereuse : le modèle a trouvé des failles dans les logiciels fondamentaux d'Internet
Anthropic n'a pas lancé Mythos en accès public après des tests internes où le modèle a trouvé et chaîné des vulnérabilités complexes dans les navigateurs…
Traité par IA depuis Bloomberg Tech ; édité par Hamidun News
Anthropic a créé Mythos comme un modèle de pointe universel, mais a découvert assez rapidement qu'elle avait obtenu non pas simplement un autre IA puissant pour le code. Lors des tests internes, Mythos a commencé à trouver et convertir en exploits fonctionnels des vulnérabilités dans le même logiciel fondamental sur lequel repose une grande partie de l'infrastructure informatique moderne. Après cela, l'entreprise a décidé de ne pas lancer le modèle en accès ouvert et l'a déplacé en mode fermé pour un cercle limité de partenaires.
Le moment décisif est arrivé lors de vérifications internes de sécurité, quand le chercheur d'Anthropic Nicholas Carlini a commencé à tester délibérément le modèle sur des scénarios malveillants. Mythos a impressionné même les personnes qui effectuent professionnellement des tests de stress pour l'IA et la cybersécurité. L'équipe interne d'Anthropic a conclu que le modèle est capable de trouver et d'exploiter des vulnérabilités zero-day dans tous les principaux systèmes d'exploitation et dans tous les principaux navigateurs.
Il est important de noter que Mythos n'a pas été créé comme un outil de cyberguerre spécialisé : ses capacités dangereuses, selon l'entreprise, ont émergé comme un effet secondaire de l'avancée générale en programmation, raisonnement et utilisation autonome des outils. Les investigations ultérieures ont révélé qu'il ne s'agissait pas de trucs de démonstration. Anthropic a divulgué plusieurs exemples de problèmes déjà corrigés : une vulnérabilité vieille de 27 ans dans OpenBSD, un bug vieux de 16 ans dans FFmpeg que les systèmes automatisés ont exécuté des millions de fois et n'ont jamais détecté, ainsi que des chaînes de vulnérabilités dans le noyau Linux qui permettaient de passer d'un accès utilisateur régulier au contrôle complet de la machine.
Dans un test, Mythos elle-même a assemblé un exploit de navigateur à partir de quatre vulnérabilités et a réussi à contourner plusieurs niveaux d'isolation simultanément. Selon le blog de l'équipe de sécurité d'Anthropic, plus de 99% des problèmes trouvés par le modèle restaient non corrigés au moment de la publication, donc l'entreprise ne révèle pas les détails techniques et fonctionne par le biais d'une divulgation coordonnée des vulnérabilités. La réponse à cela a été Project Glasswing, qu'Anthropic a annoncé le 7 avril 2026.
Au lieu d'une sortie régulière, l'entreprise a ouvert l'accès uniquement à des participants sélectionnés : parmi les partenaires de lancement figurent AWS, Apple, Google, Microsoft, NVIDIA, Cisco, CrowdStrike, Palo Alto Networks, Linux Foundation et JPMorganChase. Au-delà d'eux, plus de 40 organisations supplémentaires responsables de logiciels et d'infrastructures critiques ont obtenu l'accès. Anthropic souligne séparément qu'elle souhaite donner aux défenseurs un avantage : l'entreprise a alloué jusqu'à 100 millions de dollars en crédits pour utiliser Mythos Preview et 4 millions de dollars supplémentaires pour soutenir la sécurité open source.
Un lancement public pour tous les utilisateurs n'est pas actuellement prévu. L'histoire ne s'arrête pas là, car les conséquences s'étendent bien au-delà d'un laboratoire. Les banques et agences gouvernementales ont commencé à évaluer d'urgence ce qui se passerait si des modèles de cette classe parvenaient non seulement aux défenseurs, mais aussi aux groupes criminels ou aux pirates parrainés par l'État.
Le secteur financier est particulièrement nerveux : si la fenêtre entre la découverte et l'exploitation d'une vulnérabilité se rétrécit de semaines et de mois à quelques heures, les systèmes par lesquels passent les paiements, les règlements et le stockage des données seront sous le feu. C'est pourquoi les discussions autour de Mythos ont rapidement émergé non seulement dans les plus grandes entreprises technologiques, mais aussi parmi les régulateurs et les grandes institutions financières. La principale conclusion ici est que l'industrie est entrée dans une nouvelle phase.
Jusqu'à présent, le débat portait principalement sur la question de savoir si les modèles de langage pouvaient aider à écrire du code malveillant. L'histoire de Mythos montre un scénario plus grave : un modèle de pointe est capable de rechercher des faiblesses dans des bases de code complexes, d'assembler des chaînes d'attaque fonctionnelles à partir de celles-ci et de le faire à une échelle indisponible pour la plupart des équipes humaines. Pour le marché, cela signifie un changement de logique : la question n'est plus de savoir s'il faut lancer de tels systèmes en tant que produit régulier, mais si les développeurs, les fournisseurs d'infrastructure et les gouvernements parviendront à construire des défenses avant que des capacités similaires ne deviennent généralisées.
La décision d'Anthropic de retarder le lancement ne semble pas être une couverture marketing, mais plutôt une reconnaissance que la frontière entre une IA utile pour le développement et un outil d'offensive cybernétique est devenue beaucoup plus mince.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.