Arquitetura de agente AI em produção: o sistema completo de 13 blocos da Anthropic
A Anthropic revelou a arquitetura dos agentes em produção: não é um prompt mágico, mas um sistema claramente estruturado com 13 blocos independentes. Analisamos

Um agente AI de produção não é apenas um conjunto de instruções em um único prompt longo. É um sistema completo onde cada componente é responsável por um aspecto separado da operação: gerenciamento de recursos, OODA loop, distribuição de responsabilidades entre agentes, tratamento de erros, monitoramento. Sem uma arquitetura clara, seu agente funcionará de forma imprevisível.
O
Que a Anthropic Revelou A empresa publicou dois prompts de produção reais usados em sistemas em operação: research_lead_agent.md e research_subagent.md. Estes não são exemplos de livro didático, demonstrações ou versões simplificadas. São prompts reais que lidam com trabalho de verdade. Quando você os analisa, você vê uma arquitetura que não é ensinada em cursos de prompt engineering. A descoberta principal: em vez de um prompt longo mágico, Anthropic usa um sistema de 13 blocos claramente definidos e independentes. Cada bloco lida com uma tarefa e pode ser reutilizado em outros agentes. Isso significa que a arquitetura escala não através de reescrita, mas através de composição.
13
Blocos que Todo Agente de Produção Precisa Aqui está a lista completa de componentes que devem estar presentes em qualquer agente de produção: Papel e persona — definir como o agente pensa e se comporta Objetivo e contexto — especificação clara do que precisa ser feito e por quê Orçamento de chamadas e limite de recursos — o ponto de parada OODA loop — o ciclo Observe→Orient→Decide→Act que se repete Tratamento de erros e estratégias de fallback — ações quando algo falha Distribuição de responsabilidades entre agentes — dividir o trabalho Ferramentas e suas limitações — o que o agente pode e não pode usar Formato de saída e validação de resultados — como verificar a correção Monitoramento e logging — uma forma de ver o que acontece dentro Timeouts e lógica de retry — prevenção de travamentos e falhas repetidas Auto-verificação e verificação — o agente verifica a si mesmo antes da saída Normalização de estado — formatar o resultado em forma legível * Guardrails e camada de segurança — prevenção de violações de limite Isso não é opcional e não é "nice to have". Se até mesmo um componente está faltando, o agente se comportará instável e imprevisivelmente. Já vi isso dezenas de vezes — agentes perdem contexto, excedem orçamento, travam em casos extremos.
Lead e Sub: Divisão de Trabalho A diferença entre um agente lead e um agente sub é fundamental.
Lead é um estrategista e coordenador. Ele vê o quadro geral completo, planeja estratégia, toma decisões-chave, gerencia o trabalho de um time inteiro de agentes sub. Agente sub é um especialista estreito. Rápido, barato para chamar, pega uma tarefa específica e bem definida e relata o resultado. Sub ouve o lead e não mostra iniciativa. Anthropic usa esse esquema porque escala. Um lead pode coordenar cinco agentes sub. Depois você adiciona mais cinco — o lead os gerencia. Mais cinco — tudo funciona. Você não reescreve o lead, não muda a arquitetura. Apenas expande o time.
Template
Pronto à Mão Depois de analisar os prompts da Anthropic, extrai padrões e criei um template SKILL.md. Usando este template, você pode passar pelo seu agente e garantir que não perdeu nada. É como a lista de verificação de um piloto antes da decolagem, mas para agentes AI. A regra principal: use antes de ir para produção. Porque adicionar componentes "na mosca" e reescrever prompts em condições ao vivo é um pesadelo. Gaste um dia na arquitetura — depois você será grato por meses.
O
Que Isso Significa Se você está construindo um agente agora, essa arquitetura pode economizar semanas de depuração. Porque geralmente todos os componentes aparecem no código aleatoriamente quando o desastre já aconteceu — o agente travou, excedeu orçamento, ficou preso em um caso extremo. Agora você tem um template testado. Use-o.