Habr AI→ original

Arquitetura de agente AI em produção: o sistema completo de 13 blocos da Anthropic

A Anthropic revelou a arquitetura dos agentes em produção: não é um prompt mágico, mas um sistema claramente estruturado com 13 blocos independentes…

Processado por IA de Habr AI; editado por Hamidun News
Arquitetura de agente AI em produção: o sistema completo de 13 blocos da Anthropic
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

Um agente AI de produção não é apenas um conjunto de instruções em um único prompt longo. É um sistema completo onde cada componente é responsável por um aspecto separado da operação: gerenciamento de recursos, OODA loop, distribuição de responsabilidades entre agentes, tratamento de erros, monitoramento. Sem uma arquitetura clara, seu agente funcionará de forma imprevisível.

O

Que a Anthropic Revelou A empresa publicou dois prompts de produção reais usados em sistemas em operação: research_lead_agent.md e research_subagent.md. Estes não são exemplos de livro didático, demonstrações ou versões simplificadas. São prompts reais que lidam com trabalho de verdade. Quando você os analisa, você vê uma arquitetura que não é ensinada em cursos de prompt engineering. A descoberta principal: em vez de um prompt longo mágico, Anthropic usa um sistema de 13 blocos claramente definidos e independentes. Cada bloco lida com uma tarefa e pode ser reutilizado em outros agentes. Isso significa que a arquitetura escala não através de reescrita, mas através de composição.

13

Blocos que Todo Agente de Produção Precisa Aqui está a lista completa de componentes que devem estar presentes em qualquer agente de produção: Papel e persona — definir como o agente pensa e se comporta Objetivo e contexto — especificação clara do que precisa ser feito e por quê Orçamento de chamadas e limite de recursos — o ponto de parada OODA loop — o ciclo Observe→Orient→Decide→Act que se repete Tratamento de erros e estratégias de fallback — ações quando algo falha Distribuição de responsabilidades entre agentes — dividir o trabalho Ferramentas e suas limitações — o que o agente pode e não pode usar Formato de saída e validação de resultados — como verificar a correção Monitoramento e logging — uma forma de ver o que acontece dentro Timeouts e lógica de retry — prevenção de travamentos e falhas repetidas Auto-verificação e verificação — o agente verifica a si mesmo antes da saída Normalização de estado — formatar o resultado em forma legível * Guardrails e camada de segurança — prevenção de violações de limite Isso não é opcional e não é "nice to have". Se até mesmo um componente está faltando, o agente se comportará instável e imprevisivelmente. Já vi isso dezenas de vezes — agentes perdem contexto, excedem orçamento, travam em casos extremos.

Lead e Sub: Divisão de Trabalho A diferença entre um agente lead e um agente sub é fundamental.

Lead é um estrategista e coordenador. Ele vê o quadro geral completo, planeja estratégia, toma decisões-chave, gerencia o trabalho de um time inteiro de agentes sub. Agente sub é um especialista estreito. Rápido, barato para chamar, pega uma tarefa específica e bem definida e relata o resultado. Sub ouve o lead e não mostra iniciativa. Anthropic usa esse esquema porque escala. Um lead pode coordenar cinco agentes sub. Depois você adiciona mais cinco — o lead os gerencia. Mais cinco — tudo funciona. Você não reescreve o lead, não muda a arquitetura. Apenas expande o time.

Template

Pronto à Mão Depois de analisar os prompts da Anthropic, extrai padrões e criei um template SKILL.md. Usando este template, você pode passar pelo seu agente e garantir que não perdeu nada. É como a lista de verificação de um piloto antes da decolagem, mas para agentes AI. A regra principal: use antes de ir para produção. Porque adicionar componentes "na mosca" e reescrever prompts em condições ao vivo é um pesadelo. Gaste um dia na arquitetura — depois você será grato por meses.

O

Que Isso Significa Se você está construindo um agente agora, essa arquitetura pode economizar semanas de depuração. Porque geralmente todos os componentes aparecem no código aleatoriamente quando o desastre já aconteceu — o agente travou, excedeu orçamento, ficou preso em um caso extremo. Agora você tem um template testado. Use-o.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…