Cisco открыла FAPO: автооптимизация LLM-пайплайнов с диагностикой на каждом шаге
Cisco Foundation AI открыла исходный код FAPO — системы автоматической оптимизации многошаговых LLM-пайплайнов. Инструмент работает на базе Claude Code…
Traité par IA depuis MarkTechPost ; édité par Hamidun News
Cisco Foundation AI a mis FAPO à la disposition du public — un système d'optimisation automatique des prompts qui opère au niveau d'un pipeline complet, pas de requêtes individuelles. L'orchestration est effectuée par Claude Code, transformant le processus de réglage en un cycle entièrement autonome.
Pourquoi une
Seule Requête ne Suffit Pas La plupart des produits d'IA modernes ne sont pas une seule requête à un modèle de langage, mais une chaîne d'étapes interconnectées : l'une extrait les données, la deuxième classe, la troisième raisonne, la quatrième génère la réponse finale. Lorsque la qualité globale baisse, trouver manuellement à quel étape exacte on perd en précision est une tâche longue et peu évidente. Les systèmes existants d'optimisation des prompts, notamment le populaire GEPA, traitent chaque prompt isolément : ils ne tiennent pas compte de la façon dont modifier une étape affecte les données d'entrée et la qualité des étapes suivantes.
FAPO est construit sur des principes fondamentalement différents — il voit le pipeline dans son ensemble et l'optimise comme un système interconnecté.
Comment
Fonctionne le Cycle d'Optimisation FAPO fonctionne en quatre étapes qui se répètent itérativement : Diagnostic : le système exécute le pipeline sur un ensemble de test et mesure la précision à chaque étape. Cela identifie l'étape spécifique où la qualité est perdue — les auteurs l'appellent attribution d'erreur au niveau des étapes. Génération de Variantes : pour l'étape problématique, FAPO propose des corrections à trois niveaux — prompt (nouvelle formulation de l'instruction), paramètres (température, top-p), structure du pipeline (ajouter ou supprimer une étape).
Validation Indépendante : chaque variante est évaluée par un agent examinateur LLM séparé qui prend des décisions basées uniquement sur des métriques — sans parti pris de la part de l'auteur du changement. Itération : le cycle se répète jusqu'à ce que la précision cible soit atteinte ou que le budget de tentatives soit épuisé. Claude Code sert d'orchestrateur : il exécute séquentiellement les diagnostics, invoque les générateurs de variantes, transmet les données à l'examinateur et applique les modifications approuvées.
Tout cela se fait sans intervention humaine.
Benchmarks : FAPO vs GEPA
Cisco a comparé FAPO à GEPA — l'une des principales méthodes d'optimisation automatique des prompts. Le résultat a été convaincant : FAPO a gagné dans 15 des 18 comparaisons entre combinaisons modèle + tâche.
« L'approche avec attribution d'erreur au niveau des étapes est
particulièrement efficace lorsque le problème n'est pas localisé dans un seul prompt, mais réparti sur plusieurs transitions dans la chaîne », notent les auteurs dans la documentation technique. L'avantage clé de FAPO est précisément dans le contexte multi-étapes : GEPA et les systèmes similaires observent chaque prompt séparément. FAPO comprend que la sortie d'une étape est l'entrée de la suivante, et optimise la chaîne en tenant compte de ces dépendances. Ceci est critique pour les systèmes d'agents, où modifier une étape antérieure a des effets en cascade sur toutes les étapes ultérieures.
Ce
Que Cela Signifie Cisco a publié FAPO sous une licence ouverte — le système peut être déployé sur vos pipelines dès maintenant. Pour les équipes construisant des agents d'IA multi-étapes, c'est un moyen d'automatiser ce qui prenait auparavant des semaines d'essais et d'erreurs manuels. Le choix de Claude Code comme moteur d'orchestration est un signal révélateur : les outils d'IA d'entreprise sont de plus en plus construits sur l'écosystème Claude.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.
L'essentiel de l'IA — une fois par semaine
Sept actus qui ont vraiment compté, choisies à la main. Sans bruit ni communiqués.
C'est fait ! Vérifiez votre boîte mail pour la confirmation.