OpenAI proibiu Codex de falar sobre goblins e pombos nas instruções para agentes de IA
As instruções do sistema Codex da OpenAI continham uma instrução inusitada: o agente foi proibido de falar sobre goblins, gremlins, pombos e outras…
Processado por IA de Wired; editado por Hamidun News
Nas instruções de sistema do Codex, nova ferramenta de IA da OpenAI para programação, encontrou-se uma regra inusitada: o modelo é diretamente proibido de mencionar goblins, gremlins, guaxinins, trolls, ogros, pombos e outras criaturas se isso não estiver relacionado à solicitação do usuário. Pela reação de desenvolvedores e usuários, a regra apareceu após um bug bem real no modo de agente.
O que foi encontrado nas instruções
O motivo foi uma string nas instruções do Codex CLI — ferramenta de linha de comando que usa um modelo para gerar e editar código. A formulação não deixa espaço para imaginação: o agente é instruído a não falar sobre "goblins, gremlins, guaxinins, trolls, ogros, pombos e outras criaturas" a menos que seja "absolutamente e inequivocamente" relacionado à solicitação. Além disso, como os usuários notaram, essa restrição é repetida várias vezes, o que significa que não é uma inserção aleatória, mas uma regra comportamental conscientemente estabelecida.
À primeira vista parece uma piada interna da equipe, mas o contexto da história é bastante sério. A OpenAI acabou de aumentar suas apostas em programação: GPT-5.5 foi lançado com capacidades de codificação melhoradas, e a concorrência com Anthropic e outros players no mercado de ferramentas de IA para desenvolvedores se intensificou drasticamente. Nesse contexto, qualquer estranheza no comportamento do modelo deixa de ser uma curiosidade inofensiva e se torna um problema de produto, especialmente se o agente não apenas funciona em chat, mas também gerencia aplicações reais.
De onde vieram os goblins
Parece que a proibição não surgiu do nada. Depois que os prints da instrução foram compartilhados no X, usuários começaram a se lembrar que modelos da OpenAI em conjunto com OpenClaw realmente às vezes ficavam presos em tal vocabulário. Um desenvolvedor escreveu que seu claw "de repente se tornou um goblin" após mudar para Codex 5.5. Outro notou que o agente constantemente chamava bugs de "goblins" e "gremlins". Para um chatbot comum isso pareceria uma maneira de falar estranha, mas para um agente de codificação — como ruído que interfere na compreensão do resultado e na confiança nele.
"Agora está claro por que meu claw de repente se tornou um goblin com
Codex 5.5".
A WIRED atribui isso à forma como modelos modernos se comportam dentro de estruturas de agente. O modelo base prevê o próximo token e normalmente permanece dentro dos limites da tarefa, mas no modo de agente, memória, instruções de sistema, um conjunto de papéis e prompts de serviço são adicionados ao prompt. Quanto mais longa e complexa tal cadeia se torna, maior a chance de o modelo se prender a metáforas repetitivas, associações aleatórias ou estilo inapropriado. Se a IA estiver gerenciando um computador, respondendo e-mails ou processando compras, até mesmo uma leve mutação verbal se torna um sinal de que o loop precisa de restrições rigorosas.
Como um meme se tornou um produto
A história muito rapidamente saiu do chat de engenharia e se tornou um meme. Usuários começaram a postar cenas geradas com goblins em data centers, e plugins com um "goblin mode" tipo jogo até apareceram para o Codex. Mas o mais importante: funcionários da OpenAI realmente confirmaram que a proibição está relacionada ao comportamento real do modelo. O desenvolvedor do Codex Nick Pash, em resposta à discussão, escreveu que isso era "realmente uma das razões". Ou seja, a empresa não está apenas brincando, mas fechando uma classe específica de falhas comportamentais.
- Os prints da instrução se espalharam rapidamente pelas redes sociais
- Usuários começaram a compartilhar incidentes semelhantes no OpenClaw
- Plugins e memes com "goblin mode" apareceram em torno do Codex
- Sam Altman aproveitou a onda com uma brincadeira sobre "goblins extras" durante treinamento do GPT-6
Um detalhe separado é o papel do OpenClaw. Esta ferramenta permite conectar quase qualquer modelo a um computador, dar acesso a aplicações e escolher diferentes personas para o assistente. OpenAI adquiriu OpenClaw em fevereiro logo após o crescimento viral do projeto, então o comportamento de modelos dentro dessa interface não é mais exótica externa para a empresa, mas parte de sua própria plataforma. Quanto mais profundamente OpenAI avança em agentes autônomos, mais importante se torna suprimir não apenas erros perigosos, mas também deslocamentos de fala estranha.
O que isso significa
A história do goblin pode parecer um anedota, mas de fato mostra algo mais importante: desenvolvedores de agentes de IA cada vez mais tratam não apenas erros factuais, mas também o estilo de pensamento do modelo em cenários complexos. Para o mercado de assistentes de codificação, este é um sinal de que a batalha já está sendo travada no nível de ajuste fino do comportamento. A confiabilidade de um agente hoje é determinada não apenas pela qualidade do código que escreve, mas também por quão previsivelmente se comunica e age sob carga.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.