Wired→ original

OpenAI a interdit à Codex de parler de gobelins et de pigeons dans les instructions pour les agents d'IA

Les instructions système de Codex d'OpenAI contenaient une chaîne inhabituelle : l'agent était interdit de parler de gobelins, de lutins, de pigeons et…

Traité par IA depuis Wired ; édité par Hamidun News
OpenAI a interdit à Codex de parler de gobelins et de pigeons dans les instructions pour les agents d'IA
Source : Wired. Collage: Hamidun News.
◐ Écouter l'article

Dans les instructions système de Codex, le nouvel outil d'IA d'OpenAI pour la programmation, on a trouvé une règle inusuelle : le modèle est directement interdit de mentionner des gobelins, des gremlins, des ratons laveurs, des trolls, des ogres, des pigeons et autres créatures si cela n'est pas lié à la demande de l'utilisateur. Selon la réaction des développeurs et des utilisateurs, la règle est apparue après un bug tout à fait réel en mode agent.

Ce qui a été trouvé dans les instructions

Le motif était une chaîne dans les instructions de Codex CLI — outil de ligne de commande qui utilise un modèle pour générer et éditer du code. La formulation ne laisse aucune place à l'imagination : l'agent est chargé de ne pas parler de « gobelins, gremlins, ratons laveurs, trolls, ogres, pigeons et autres animaux ou créatures » sauf si cela est « absolument et sans ambiguïté » lié à la demande. De plus, comme l'ont noté les utilisateurs, cette restriction est répétée plusieurs fois, ce qui signifie qu'il ne s'agit pas d'une insertion aléatoire, mais d'une règle de comportement consciemment établie.

À première vue, cela ressemble à une blague interne de l'équipe, mais le contexte de l'histoire est tout à fait sérieux. OpenAI vient de miser davantage sur la programmation : GPT-5.5 a été lancé avec des capacités de codage améliorées, et la concurrence avec Anthropic et d'autres acteurs sur le marché des outils d'IA pour les développeurs s'est considérablement intensifiée. Dans ce contexte, toute étrangeté du comportement du modèle cesse d'être une curiosité inoffensiva et devient un problème de produit, surtout si l'agent ne fonctionne pas seulement dans le chat mais gère aussi de véritables applications.

D'où venaient les gobelins

Il semble que l'interdiction n'a pas surgi de nulle part. Après que les captures d'écran de l'instruction se soient propagées sur X, les utilisateurs ont commencé à se souvenir que les modèles d'OpenAI en conjonction avec OpenClaw s'accrochaient effectivement parfois à un tel vocabulaire. Un développeur a écrit que son claw « s'était soudainement transformé en gobelin » après le passage à Codex 5.5. Un autre a noté que l'agent appelait constamment les bugs « gobelins » et « gremlins ». Pour un chatbot ordinaire, cela ressemblerait à une façon de parler étrange, mais pour un agent de codage — comme un bruit qui interfère avec la compréhension de la sortie et la confiance en celle-ci.

«

Maintenant c'est clair pourquoi mon claw s'est soudainement transformé en gobelin avec Codex 5.5 ».

WIRED attribue cela à la façon dont les modèles modernes se comportent dans les cadres d'agent. Le modèle de base prédit le token suivant et reste généralement dans les limites de la tâche, mais en mode agent, la mémoire, les instructions système, un ensemble de rôles et des invites de service sont ajoutées au prompt. Plus cette chaîne devient longue et complexe, plus il est probable que le modèle s'accroche à des métaphores répétitives, des associations aléatoires ou un style inapproprié. Si l'IA gère un ordinateur, répond à des e-mails ou traite des achats, même une légère mutation verbale devient un signal que la boucle a besoin de contraintes strictes.

Comment un mème est devenu un produit

L'histoire s'est très rapidement échappée du chat d'ingénierie et s'est transformée en mème. Les utilisateurs ont commencé à publier des scènes générées avec des gobelins dans les centres de données, et même des plugins avec un « goblin mode » de style jeu ont apparu pour Codex. Mais ce qui est plus important : les employés d'OpenAI ont réellement confirmé que l'interdiction est liée au comportement réel du modèle. Le développeur de Codex Nick Pash, en réponse à la discussion, a écrit que c'était « vraiment l'une des raisons ». C'est-à-dire que l'entreprise ne plaisante pas seulement, mais ferme une classe spécifique de défaillances comportementales.

  • Les captures d'écran de l'instruction se sont rapidement propagées sur les réseaux sociaux
  • Les utilisateurs ont commencé à partager des incidents similaires dans OpenClaw
  • Des plugins et des mèmes avec « goblin mode » sont apparus autour de Codex
  • Sam Altman a saisi la vague avec une blague sur les « gobelins supplémentaires » lors de l'entraînement de GPT-6

Un détail distinct est le rôle d'OpenClaw. Cet outil permet de connecter presque n'importe quel modèle à un ordinateur, lui donner accès aux applications et choisir différents personnages pour l'assistant. OpenAI a acquis OpenClaw en février peu après la montée virale du projet, donc le comportement des modèles dans une telle interface n'est plus une exotica externe pour l'entreprise, mais fait partie de sa propre plateforme. Plus OpenAI s'enfonce dans les agents autonomes, plus il devient important de supprimer non seulement les erreurs dangereuses, mais aussi les changements de parole étranges.

Ce que cela signifie

L'histoire des gobelins peut sembler une anecdote, mais elle montre en fait quelque chose de plus important : les développeurs d'agents IA traitent de plus en plus non seulement les erreurs factuelles, mais aussi le style de pensée du modèle dans les scénarios complexes. Pour le marché des assistants de codage, c'est un signal que la bataille se déroule déjà au niveau de l'ajustement fin du comportement. La fiabilité d'un agent est aujourd'hui déterminée non seulement par la qualité du code qu'il écrit, mais aussi par la prévisibilité avec laquelle il communique et agit sous charge.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…