Cisco открыла FAPO: автооптимизация LLM-пайплайнов с диагностикой на каждом шаге
Cisco Foundation AI открыла исходный код FAPO — системы автоматической оптимизации многошаговых LLM-пайплайнов. Инструмент работает на базе Claude Code…
Processado por IA de MarkTechPost; editado por Hamidun News
Cisco Foundation AI disponibilizou FAPO ao público — um sistema de otimização automática de prompts que opera no nível de um pipeline inteiro, não de requisições individuais. A orquestração é executada pelo Claude Code, transformando o processo de ajuste em um ciclo totalmente autônomo.
Por
Que um Único Prompt Não é Suficiente A maioria dos produtos de IA modernos não é uma única requisição a um modelo de linguagem, mas uma cadeia de etapas interconectadas: uma extrai dados, a segunda classifica, a terceira raciocina, a quarta gera a resposta final. Quando a qualidade geral cai, encontrar manualmente em qual etapa exata se perde a precisão é uma tarefa longa e não óbvia. Os sistemas existentes de otimização de prompts, incluindo o popular GEPA, tratam cada prompt isoladamente: eles não levam em conta como alterar uma etapa afeta os dados de entrada e a qualidade das etapas subsequentes.
FAPO é construído em princípios fundamentalmente diferentes — ele vê o pipeline como um todo e o otimiza como um sistema interconectado.
Como o
Ciclo de Otimização Funciona FAPO opera em quatro etapas que se repetem iterativamente: Diagnóstico: o sistema executa o pipeline em um conjunto de testes e mede a precisão em cada etapa. Isso identifica a etapa específica onde se perde qualidade — os autores chamam isso de atribuição de falha em nível de etapa. Geração de Variantes: para a etapa problemática, FAPO propõe correções em três níveis — prompt (nova formulação da instrução), parâmetros (temperatura, top-p), estrutura do pipeline (adicionar ou remover uma etapa).
Validação Independente: cada variante é avaliada por um agente revisor de LLM separado que toma decisões baseadas apenas em métricas — sem viés do autor da mudança. Iteração: o ciclo se repete até que a precisão-alvo seja alcançada ou o orçamento de tentativas se esgote. Claude Code serve como o orquestrador: ele executa sequencialmente diagnósticos, invoca geradores de variantes, passa dados ao revisor e aplica as mudanças aprovadas.
Tudo isso acontece sem envolvimento humano.
Benchmarks: FAPO vs GEPA
Cisco comparou FAPO ao GEPA — um dos principais métodos de otimização automática de prompts. O resultado foi convincente: FAPO venceu em 15 de 18 comparações entre combinações de modelo + tarefa.
"A abordagem com atribuição de erro no nível da etapa é
particularmente eficaz onde o problema não está localizado em um único prompt, mas está espalhado por múltiplas transições na cadeia," observam os autores na documentação técnica. A vantagem-chave do FAPO é precisamente no contexto de múltiplas etapas: GEPA e sistemas similares observam cada prompt separadamente. FAPO entende que a saída de uma etapa é a entrada da próxima, e otimiza a cadeia levando em conta essas dependências. Isso é crítico para sistemas de agentes, onde alterar uma etapa inicial em cascata afeta todas as subsequentes.
O que
Isso Significa Cisco publicou FAPO sob uma licença aberta — o sistema pode ser implantado em seus pipelines agora mesmo. Para equipes construindo agentes de IA de múltiplas etapas, é uma forma de automatizar o que anteriormente levava semanas de tentativa e erro manual. A escolha do Claude Code como motor de orquestração é um sinal revelador: as ferramentas de IA corporativas estão cada vez mais sendo construídas no ecossistema Claude.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.
O essencial da IA — uma vez por semana
Sete histórias que realmente importaram, escolhidas a dedo. Sem ruído nem releases.
Pronto! Verifique seu e-mail para a confirmação.