Les agents d'IA : trois piliers qui séparent un chatbot d'un employé numérique
Si vous pensiez que GPT-4 ou Claude 3 était l'apogée de la réussite, j'ai des nouvelles pour vous. Un grand modèle de langage en lui-même est simplement un…
Traité par IA depuis Jiqizhixin (机器之心) ; édité par Hamidun News
Si vous pensiez que GPT-4 ou Claude 3 était l'apogée de la réussite, j'ai des nouvelles pour vous. Un grand modèle de langage en lui-même est simplement un conversateur très érudit, mais extrêmement distrait. Il peut écrire un sonnet sur la physique quantique, mais il ne peut pas indépendamment réserver un billet d'avion pour vous sans s'égarer dans ses propres pensées.
Pour transformer des "nuages de tags intelligents" en un véritable agent autonome capable de résoudre des tâches sans votre supervision, l'industrie a dû réinventer la roue en ajoutant trois modules critiques au réseau de neurones. Un aperçu récent des technologies de création d'agents montre que nous avons enfin trouvé l'architecture qui fonctionne réellement. La première et la plus critique question est la mémoire.
Nous sommes habitués à RAG, où le modèle jette simplement un coup d'œil à une base de données, mais pour un agent, cela ne suffit pas. Il a besoin d'une mémoire de travail pour se souvenir des résultats intermédiaires et d'une mémoire à long terme pour apprendre de ses erreurs. Imaginez un employé qui vient travailler chaque jour et oublie ce qu'il a fait hier.
C'est exactement à quoi ressemblent la plupart des chatbots modernes. Les chercheurs soulignent que la mémoire efficace doit être hybride : le modèle doit être capable de récupérer rapidement un contexte pertinent et d'ignorer le bruit, sinon le "cerveau" de l'agent déborderait simplement de déchets. Le deuxième pilier est la planification.
C'est exactement le domaine où la plupart des projets comme AutoGPT ont échoué spectaculairement il y a un an. Les modèles restaient coincés dans des boucles, répétant infiniment les mêmes actions, ou abandonnaient simplement à mi-chemin. L'approche moderne de la planification est devenue beaucoup plus sophistiquée.
Ce n'est plus simplement une chaîne de pensée (Chain of Thought), mais un système dynamique. Un agent doit être capable de décomposer un objectif complexe en petites sous-tâches, d'évaluer ses chances de succès dans chacune d'elles et, surtout, de modifier le plan en cours de route si quelque chose ne va pas. Cela transforme l'IA d'un exécuteur passif en une stratège actif.
Le troisième élément est l'utilisation d'outils. Sans cela, un agent n'est qu'un philosophe dans un tonneau. Pour être utile, il doit être capable d'appeler des API, d'écrire et d'exécuter du code, de rechercher des informations dans un navigateur et d'interagir avec des logiciels d'entreprise.
Mais le problème est que les outils changent constamment, il en existe des milliers, et enseigner à un modèle comment utiliser chacun est impossible. L'accent s'est donc déplacé vers "l'apprentissage des outils" : l'agent doit lui-même comprendre quel marteau il lui faut pour un clou particulier et être capable de lire les instructions d'un nouveau logiciel sans aide humaine. Pourquoi cela importe-t-il maintenant ?
Parce que nous avons atteint le plafond de l'intelligence "pure". Augmenter simplement les paramètres d'un modèle ne fournit plus la croissance explosive de la productivité que tout le monde espérait. L'avenir n'appartient pas aux énormes réseaux de neurones monolithiques, mais aux systèmes complexes où un LLM n'agit que comme processeur central, entouré d'une périphérie de mémoire, de planificateurs et d'interfaces externes.
C'est la transition des jouets de génération de texte aux véritables outils d'automatisation commerciale. L'essentiel : l'ère de la concurrence pour le nombre de paramètres du modèle prend fin, la bataille pour l'architecture des agents commence. Votre assistant IA sera-t-il capable de travailler de manière autonome pendant au moins une heure sans transformer la tâche en chaos ?
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.