HKUDS Présente OpenSpace en Détail — Moteur d'Auto-Évolution de Compétences pour Agents IA
HKUDS a lancé un tutoriel détaillé sur OpenSpace — un moteur qui permet aux agents IA d'apprendre des tâches complétées et de réutiliser les compétences. Le…
Traité par IA depuis MarkTechPost ; édité par Hamidun News
HKUDS a publié une analyse détaillée d'OpenSpace — un moteur de compétences open-source qui permet aux agents d'IA de ne pas recommencer chaque tâche de zéro, mais d'accumuler des modèles de travail et de les réutiliser. Le document montre le cycle complet : de la configuration d'un modèle OpenAI à la comparaison entre les démarrages « à froid » et « à chaud », où la réutilisation de compétences réduit la consommation de tokens et améliore la qualité des réponses.
Du démarrage à froid
OpenSpace est déployé à partir d'un référentiel GitHub et dans le tutoriel est configuré pour les modèles OpenAI, y compris gpt-4o-mini. Ensuite, l'agent reçoit sa première tâche sans aucune bibliothèque de compétences préconstruite. Le système l'exécute comme un agent LLM ordinaire, mais en parallèle capture les étapes réussies, les contournements et les instructions de travail qui peuvent être réutilisés ultérieurement.
Les compétences ne vivent pas seulement dans le contexte du dialogue : elles sont enregistrées sous forme de fichiers suivant la convention SKILL.md et enregistrées dans une base de données SQLite, afin qu'elles puissent être visualisées, versionnées et analysées séparément de l'exécution réelle. Après cela, les auteurs lancent à nouveau une tâche similaire et montrent la différence entre démarrage à froid et démarrage à chaud.
Ici, OpenSpace ne raisonne plus à partir de zéro, mais sélectionne les compétences appropriées via une recherche hybride sur BM25 et embeddings. Dans la démonstration, ils créent manuellement trois compétences de base : la validation des données, la génération de rapports avec scénarios de secours et un mécanisme de récupération d'erreurs. Cela est nécessaire pour implanter d'avance des modèles utiles, puis laisser le moteur évolutif les développer sur des tâches réelles.
Comment les compétences se développent L'idée clé d'OpenSpace est
qu'une compétence ici est considérée non pas comme un prompt statique, mais comme une entité vivante. Après chaque exécution, le système analyse ce qui a fonctionné, où les défaillances se sont produites, quels outils se sont dégradés et ce qui peut être amélioré dans la version suivante. Par conséquent, le moteur non seulement accumule des scénarios réussis, mais sait également comment les corriger, les spécialiser pour de nouvelles tâches et extraire de nouvelles compétences à partir d'exécutions réussies individuelles.
- FIX — corrige une compétence cassée ou obsolète sans modifier son rôle.
- DERIVED — crée une version dérivée pour un scénario plus étroit ou une nouvelle classe de tâches.
- CAPTURED — extrait un nouveau modèle réutilisable directement de l'exécution réussie.
- BM25 + embeddings — aide à trouver rapidement la compétence la plus pertinente pour une description de tâche. * open-space.cloud — fournit un catalogue partagé où les compétences peuvent être recherchées, téléchargées, téléversées et partagées entre équipes. Une partie importante de l'architecture est la couche collective. Via une communauté cloud, les agents peuvent échanger des compétences déjà évoluées, consulter l'historique des versions et construire des référentiels partagés pour les équipes. L'article présente cela comme une transition d'un assistant unique à un réseau d'agents qui apprennent non seulement de leurs propres erreurs. Si un agent trouve une solution fiable pour la génération de PDF, l'analyse de tableaux ou la recherche web, un autre peut prendre cette compétence et ne pas répéter le même cycle d'essais et d'erreurs.
Économie des tokens
OpenSpace La partie la plus forte du matériel n'est pas la configuration, mais les chiffres. Le référentiel OpenSpace fournit un benchmark GDPVal sur une sélection de 50 tâches professionnelles dans six catégories : documents, formulaires de conformité, médias, ingénierie, feuilles de calcul et stratégie. Pour une comparaison équitable, OpenSpace a été comparé avec un agent ClawWork de base sur le même modèle Qwen 3.
5-Plus, de sorte que la différence s'explique précisément par l'accumulation de compétences plutôt que par le remplacement du modèle. Le résultat — rendement économique 4,2 fois supérieur, qualité moyenne de 70,8 % et 45,9 % moins de tokens lors des réexécutions de tâches. La ventilation par catégorie montre où l'auto-évolution offre le maximum.
Dans les documents et la correspondance, l'exécution à chaud a réduit la consommation de tokens de 56 %, dans les tâches de formulaires et de conformité — de 51 %, dans les médias — de 46 %, dans les feuilles de calcul — de 37 %. Parallèlement, les auteurs soulignent que sur les 165 compétences évoluées, la majorité n'appartient pas à l'expertise de domaine étroite, mais à la fiabilité de l'exécution : gestion des formats de fichiers, récupération d'erreurs, génération de documents et vérification de qualité. Autrement dit, le principal avantage ne vient pas de la « connaissance du domaine », mais du fait que l'agent cesse de se casser aux endroits techniques typiques.
Qu'est-ce que cela signifie
OpenSpace montre bien où vont les frameworks d'agents : des prompts ponctuels à la mémoire de travail persistante, où chaque tâche accomplie rend le système plus économique et plus robuste. Pour les équipes produit, c'est un signal que la prochaine vague d'efficacité viendra non seulement de nouveaux modèles, mais aussi de l'infrastructure des compétences réutilisables autour d'eux.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.