MarkTechPost→ original

Cisco открыла FAPO: автооптимизация LLM-пайплайнов с диагностикой на каждом шаге

Cisco Foundation AI открыла исходный код FAPO — системы автоматической оптимизации многошаговых LLM-пайплайнов. Инструмент работает на базе Claude Code…

Processado por IA de MarkTechPost; editado por Hamidun News
Cisco открыла FAPO: автооптимизация LLM-пайплайнов с диагностикой на каждом шаге
Fonte: MarkTechPost. Colagem: Hamidun News.
◐ Ouvir artigo

Cisco Foundation AI disponibilizou FAPO ao público — um sistema de otimização automática de prompts que opera no nível de um pipeline inteiro, não de requisições individuais. A orquestração é executada pelo Claude Code, transformando o processo de ajuste em um ciclo totalmente autônomo.

Por

Que um Único Prompt Não é Suficiente A maioria dos produtos de IA modernos não é uma única requisição a um modelo de linguagem, mas uma cadeia de etapas interconectadas: uma extrai dados, a segunda classifica, a terceira raciocina, a quarta gera a resposta final. Quando a qualidade geral cai, encontrar manualmente em qual etapa exata se perde a precisão é uma tarefa longa e não óbvia. Os sistemas existentes de otimização de prompts, incluindo o popular GEPA, tratam cada prompt isoladamente: eles não levam em conta como alterar uma etapa afeta os dados de entrada e a qualidade das etapas subsequentes.

FAPO é construído em princípios fundamentalmente diferentes — ele vê o pipeline como um todo e o otimiza como um sistema interconectado.

Como o

Ciclo de Otimização Funciona FAPO opera em quatro etapas que se repetem iterativamente: Diagnóstico: o sistema executa o pipeline em um conjunto de testes e mede a precisão em cada etapa. Isso identifica a etapa específica onde se perde qualidade — os autores chamam isso de atribuição de falha em nível de etapa. Geração de Variantes: para a etapa problemática, FAPO propõe correções em três níveis — prompt (nova formulação da instrução), parâmetros (temperatura, top-p), estrutura do pipeline (adicionar ou remover uma etapa).

Validação Independente: cada variante é avaliada por um agente revisor de LLM separado que toma decisões baseadas apenas em métricas — sem viés do autor da mudança. Iteração: o ciclo se repete até que a precisão-alvo seja alcançada ou o orçamento de tentativas se esgote. Claude Code serve como o orquestrador: ele executa sequencialmente diagnósticos, invoca geradores de variantes, passa dados ao revisor e aplica as mudanças aprovadas.

Tudo isso acontece sem envolvimento humano.

Benchmarks: FAPO vs GEPA

Cisco comparou FAPO ao GEPA — um dos principais métodos de otimização automática de prompts. O resultado foi convincente: FAPO venceu em 15 de 18 comparações entre combinações de modelo + tarefa.

"A abordagem com atribuição de erro no nível da etapa é

particularmente eficaz onde o problema não está localizado em um único prompt, mas está espalhado por múltiplas transições na cadeia," observam os autores na documentação técnica. A vantagem-chave do FAPO é precisamente no contexto de múltiplas etapas: GEPA e sistemas similares observam cada prompt separadamente. FAPO entende que a saída de uma etapa é a entrada da próxima, e otimiza a cadeia levando em conta essas dependências. Isso é crítico para sistemas de agentes, onde alterar uma etapa inicial em cascata afeta todas as subsequentes.

O que

Isso Significa Cisco publicou FAPO sob uma licença aberta — o sistema pode ser implantado em seus pipelines agora mesmo. Para equipes construindo agentes de IA de múltiplas etapas, é uma forma de automatizar o que anteriormente levava semanas de tentativa e erro manual. A escolha do Claude Code como motor de orquestração é um sinal revelador: as ferramentas de IA corporativas estão cada vez mais sendo construídas no ecossistema Claude.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…