Claude Code e Codex mudam as regras: prompts dão lugar à engenharia de contexto

Q: Qual é a fonte?

Publicado originalmente em Habr AI. O Hamidun News processa e adapta os materiais com IA.

Q: Quando foi publicado?

27 de abr. de 2026. Tempo de leitura: 3 min.

Engenharia de prompts em IDEs agentivos não é mais o fator principal de qualidade. Uma análise abrangente de Context Engineering explica que em Claude Code…

Redação da Hamidun News

Monitoramento de AI · Habr AI

27 de abr. de 2026· 3 min

Processado por IA de Habr AI; editado por Hamidun News

Claude Code e Codex mudam as regras: prompts dão lugar à engenharia de contexto — Fonte: Habr AI. Colagem: Hamidun News.

◐ Ouvir artigo

No Habr AI, foi publicada uma grande análise sobre Context Engineering, e sua tese principal é extremamente prática: em ferramentas de agentes como Claude Code, Codex e Cursor, a qualidade dos resultados agora depende não tanto da formulação do pedido, mas de todo o ambiente ao redor do modelo. O próprio texto do usuário ocupa uma fração minúscula do contexto, enquanto a influência decisória vem do prompt do sistema, instruções do projeto, memória entre sessões, ferramentas, histórico de diálogos e resultados de chamadas de ferramentas. Em outras palavras, a era do "prompt mágico" está terminando, e a engenharia de contexto está tomando seu lugar.

A ideia principal gira em torno da natureza da janela de contexto. Propõe-se percebê-la como a mesa de trabalho do modelo: quanto mais papéis aleatórios nela, pior a atenção se distribui entre os sinais realmente importantes. Contexto longo não é apenas mais caro.

Reduz a qualidade devido a dois efeitos. O primeiro é context rot, quando a atenção se espalha, o modelo começa a esquecer restrições anteriores, fica preso em pontos antigos e dá respostas mais vagas. O segundo é reasoning shift: conforme o contexto cresce, parte do recurso computacional vai para processar a entrada em vez de raciocinar, então a resposta pode soar confiante mas ser menos bem justificada.

O artigo fornece uma estimativa de que contexto longo pode inesperadamente cortar a profundidade do raciocínio em até 50 por cento. Por que isso acontece, o autor explica através da arquitetura Transformer. Attention em sua forma básica tem complexidade quadrática O(n^2): cada token deve se relacionar com cada outro.

Portanto, adicionar documentos, arquivos e correspondência longa dimensiona o custo não linearmente, mas quadraticamente. Na prática, isso afeta todos os quatro parâmetros de uma vez: velocidade de resposta, custo, limites e precisão. Daí a tese principal: uma boa engenharia de contexto não é "meter tudo no modelo", mas selecionar o conjunto mínimo de tokens de alto sinal que maximiza a chance do resultado desejado.

Além disso, o material discute do que o contexto é feito em sistemas de agentes. Além dos próprios pesos do modelo, existem pelo menos várias camadas gerenciáveis: prompt do sistema, arquivos de projeto como CLAUDE.md ou AGENTS.

md, memória do usuário e projeto, skills com processos prontos, integrações MCP, arquivos carregados especificamente e todo o histórico tool_result. Ênfase especial é colocada no fato de que o modelo não "lembra" a conversa por si mesmo: o harness remonta e reenvia o histórico para ele cada vez. Por causa disso, cada descrição desnecessária de ferramenta, cada servidor MCP não utilizado e cada arquivo de sistema longo começam a consumir tokens muitas vezes.

Para economizar tokens, são necessários prompt cache, compact deliberado, novas sessões via clear e isolamento de pesquisa pesada em subagentes, para que o agente principal receba não montanhas de dados intermediários, mas um resumo breve. A parte mais prática diz respeito ao custo do modo agente. Um pedido a um agente pode não ser uma única chamada ao modelo, mas toda uma cadeia de várias chamadas com tool use.

No exemplo de análise de um deployment falhado, uma mensagem do usuário se torna quatro chamadas do modelo e três execuções de ferramentas. Sem caching, tal ciclo rapidamente se torna economicamente sem sentido; com prompt cache o preço cai drasticamente, mas mesmo assim é importante lembrar que tokens de saída e thinking oculto custam mais que entrada regular, e definições de ferramentas longas e instruções do sistema acabam em cada rodada. Daí a conclusão do autor: um mestre não se distingue por escrever prompts mais inteligentes, mas por montar um ambiente reproduzível uma vez — com regras do projeto, memória, ferramentas relevantes e processos — e então fazer o agente trabalhar de acordo com esse contrato.

Para o mercado de desenvolvimento de AI, isso é uma mudança importante. A competição é cada vez menos sobre bonita formulação de consultas e cada vez mais sobre a qualidade da montagem de contexto, disciplina de tokens e engenharia do ambiente do agente. Equipes que aprendem a gerenciar memória, ferramentas e histórico tão cuidadosamente quanto antes gerenciavam prompts obterão não apenas respostas mais precisas, mas também custos previsíveis.

Isso significa que o próximo estágio da evolução de ferramentas de AI será determinado não pela magia do prompt, mas pela arquitetura do contexto.

Hamidun News

Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Canal do Telegram RSS hamidun.com

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

🎓 Academy — 7 dias grátis Consultoria grátis