Claude Code y Codex cambian las reglas: los prompts ceden lugar a la ingeniería de contexto

Q: ¿Cuál es la fuente?

Publicado originalmente en Habr AI. Hamidun News procesa y adapta los materiales con IA.

Q: ¿Cuándo se publicó?

27 abr 2026. Tiempo de lectura: 3 min.

La ingeniería de prompts en IDEs agentivos ya no es el factor principal de calidad. Un análisis detallado de Context Engineering explica que en Claude Code…

Redacción de Hamidun News

Monitoreo de AI · Habr AI

27 abr 2026· 3 min

Procesado por IA desde Habr AI; editado por Hamidun News

Claude Code y Codex cambian las reglas: los prompts ceden lugar a la ingeniería de contexto — Fuente: Habr AI. Collage: Hamidun News.

◐ Escuchar artículo

En Habr AI se publicó un gran análisis sobre Context Engineering, y su tesis principal es sumamente práctica: en herramientas de agentes como Claude Code, Codex y Cursor, la calidad de los resultados ahora depende no tanto de la formulación de la consulta, sino de todo el entorno alrededor del modelo. El propio texto del usuario ocupa una fracción minúscula del contexto, mientras que la influencia decisiva proviene del prompt del sistema, instrucciones del proyecto, memoria entre sesiones, herramientas, historial de diálogos y resultados de llamadas de herramientas. En otras palabras, la era del "prompt mágico" está terminando, y la ingeniería de contexto está tomando su lugar.

La idea clave gira en torno a la naturaleza de la ventana de contexto. Se propone percibirla como el escritorio del modelo: cuantos más papeles aleatorios en él, peor se distribuye la atención entre las señales realmente importantes. El contexto largo no solo es más caro.

Reduce la calidad debido a dos efectos. El primero es context rot, cuando la atención se dispersa, el modelo comienza a olvidar restricciones anteriores, se queda atrapado en puntos antiguos y da respuestas más vagas. El segundo es reasoning shift: conforme crece el contexto, parte del recurso computacional se dedica a procesar la entrada en lugar de razonar, por lo que la respuesta puede soar confiada pero estar menos bien justificada.

El artículo proporciona una estimación de que el contexto largo puede inesperadamente reducir la profundidad del razonamiento hasta un 50 por ciento. Por qué sucede esto, el autor lo explica a través de la arquitectura Transformer. Attention en su forma básica tiene complejidad cuadrática O(n^2): cada token debe relacionarse con cada otro.

Por lo tanto, agregar documentos, archivos y correspondencia larga escala el costo no linealmente, sino cuadráticamente. En la práctica, esto afecta los cuatro parámetros a la vez: velocidad de respuesta, costo, límites y precisión. De ahí la tesis principal: la buena ingeniería de contexto no es "meter todo en el modelo", sino seleccionar el conjunto mínimo de tokens de alto valor que maximiza la probabilidad del resultado deseado.

Además, el material analiza de qué está hecho el contexto en sistemas de agentes. Más allá de los propios pesos del modelo, hay al menos varias capas gestionables: prompt del sistema, archivos de proyecto como CLAUDE.md o AGENTS.

md, memoria del usuario y del proyecto, skills con procesos listos, integraciones MCP, archivos cargados específicamente y todo el historial tool_result. Se hace énfasis especial en el hecho de que el modelo no "recuerda" la conversación por sí mismo: el harness reensambla y reenvía el historial cada vez. Por esto, cada descripción innecesaria de herramienta, cada servidor MCP no utilizado y cada archivo de sistema largo comienzan a consumir tokens muchas veces.

Para ahorrar tokens, se necesitan prompt cache, compact deliberado, nuevas sesiones vía clear e aislamiento de investigación pesada en subagentes, para que el agente principal reciba no montañas de datos intermedios, sino un resumen breve. La parte más práctica concierne al costo del modo agente. Una solicitud a un agente puede no ser una única llamada al modelo, sino toda una cadena de varias llamadas con tool use.

En el ejemplo de análisis de un despliegue fallido, un mensaje del usuario se convierte en cuatro llamadas del modelo y tres ejecuciones de herramientas. Sin caché, tal ciclo rápidamente se vuelve económicamente sin sentido; con prompt cache el precio cae drásticamente, pero incluso entonces es importante recordar que los tokens de salida y el thinking oculto cuestan más que la entrada regular, y las definiciones de herramientas largas e instrucciones del sistema terminan en cada ronda. De ahí la conclusión del autor: un maestro no se distingue por escribir prompts más ingeniosos, sino por ensamblar un entorno reproducible una vez — con reglas del proyecto, memoria, herramientas relevantes y procesos — e luego hacer que el agente trabaje de acuerdo con este contrato.

Para el mercado del desarrollo de IA, este es un cambio importante. La competencia es cada vez menos sobre la formulación hermosa de consultas y cada vez más sobre la calidad del ensamblaje de contexto, la disciplina de tokens y la ingeniería del entorno del agente. Los equipos que aprendan a gestionar la memoria, herramientas e historial tan cuidadosamente como antes gestionaban prompts obtendrán no solo respuestas más precisas, sino también costos predecibles.

Esto significa que la siguiente etapa de la evolución de herramientas de IA será determinada no por la magia del prompt, sino por la arquitectura del contexto.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita