Habr AI→ original

Arquitectura de un agente de AI en producción: el sistema completo de 13 bloques de Anthropic

Anthropic reveló la arquitectura de los agentes en producción: no es un prompt mágico, sino un sistema claramente estructurado con 13 bloques independientes. De

Arquitectura de un agente de AI en producción: el sistema completo de 13 bloques de Anthropic
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

Un agente AI de producción no es simplemente un conjunto de instrucciones en un único prompt largo. Es un sistema completo donde cada componente es responsable de un aspecto separado de la operación: gestión de recursos, OODA loop, distribución de responsabilidades entre agentes, manejo de errores, monitoreo. Sin una arquitectura clara, tu agente funcionará de manera impredecible.

Lo

Que Reveló Anthropic La empresa publicó dos prompts de producción reales utilizados en sistemas en vivo: research_lead_agent.md y research_subagent.md. Estos no son ejemplos de libro de texto, demostraciones o versiones simplificadas. Son prompts reales que manejan trabajo verdadero. Cuando los analizas, ves una arquitectura que no se enseña en cursos de prompt engineering. El descubrimiento clave: en lugar de un prompt largo mágico, Anthropic usa un sistema de 13 bloques claramente definidos e independientes. Cada bloque maneja una tarea y puede ser reutilizado en otros agentes. Esto significa que la arquitectura escala no a través de reescritura, sino a través de composición.

13

Bloques que Todo Agente de Producción Necesita Aquí está la lista completa de componentes que debe estar presente en cualquier agente de producción: Rol y persona — definir cómo piensa y se comporta el agente Objetivo y contexto — especificación clara de qué necesita hacerse y por qué Presupuesto de llamadas y techo de recursos — el umbral para cuándo detener OODA loop — el ciclo Observe→Orient→Decide→Act que se repite Manejo de errores y estrategias de fallback — acciones cuando algo falla Distribución de responsabilidades entre agentes — dividir el trabajo Herramientas y sus limitaciones — lo que el agente puede y no puede usar Formato de salida y validación de resultados — cómo verificar la corrección Monitoreo y logging — una forma de ver qué sucede internamente Timeouts y lógica de reintentos — prevención de cuelgues y fallos repetidos Auto-verificación y verificación — el agente se verifica a sí mismo antes de la salida Normalización de estado — formatear el resultado en forma legible * Guardrails y capa de seguridad — prevención de violaciones de límites Esto no es opcional y no es "nice to have". Si falta incluso un componente, el agente se comportará inestable e impredeciblemente. He visto esto docenas de veces — los agentes pierden contexto, exceden presupuesto, se cuelgan en casos extremos.

Lead y Sub: División del Trabajo La diferencia entre un agente lead y un agente sub es fundamental.

Lead es un estratega y coordinador. Ve el panorama completo, planifica estrategia, toma decisiones clave, gestiona el trabajo de todo un equipo de agentes sub. Agente sub es un especialista estrecho. Rápido, barato de llamar, toma una tarea específica y bien definida e informa el resultado. Sub escucha al lead y no muestra iniciativa. Anthropic usa este esquema porque escala. Un lead puede coordinar cinco agentes sub. Luego añades cinco más — el lead los maneja. Cinco más — todo funciona. No reescribes el lead, no cambias la arquitectura. Solo expandes el equipo.

Template

Listo en la Mano Después de analizar los prompts de Anthropic, extraje patrones y creé una plantilla SKILL.md. Usando esta plantilla, puedes revisar tu agente y asegurarte de que no has perdido nada. Es como la lista de verificación de un piloto antes del despegue, pero para agentes AI. La regla clave: úsalo ANTES de ir a producción. Porque añadir componentes "sobre la marcha" y reescribir prompts en condiciones en vivo es una pesadilla. Dedica un día a la arquitectura — luego estarás agradecido durante meses.

Lo

Que Esto Significa Si estás construyendo un agente ahora mismo, esta arquitectura puede ahorrarte semanas de depuración. Porque normalmente todos los componentes aparecen en código aleatoriamente cuando el desastre ya ha ocurrido — el agente se cuelga, excede presupuesto, se queda atrapado en un caso extremo. Ahora tienes una plantilla probada. Úsala.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.
¿Qué te parece?
Cargando comentarios…