Habr AI→ original

FS-Researcher : pourquoi votre IA doit avoir un carnet et arrêter de faire l'idiot

FS-Researcher : Pourquoi votre IA devrait avoir un carnet et arrêter d'être bête Imaginez que vous essayez d'écrire une thèse de doctorat, mais que vous avez…

Traité par IA depuis Habr AI ; édité par Hamidun News
FS-Researcher : pourquoi votre IA doit avoir un carnet et arrêter de faire l'idiot
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

FS-Researcher : Pourquoi votre IA devrait avoir un carnet et arrêter d'être bête

Imaginez que vous essayez d'écrire une thèse de doctorat, mais que vous avez la mémoire d'un poisson rouge. Vous lisez la cinquantième source, et à ce moment-là, les détails de la première s'évaporent simplement. C'est exactement ainsi que se sentent même les modèles de langage les plus avancés comme GPT-4o ou Claude 3.

5 Sonnet maintenant. Ils ont une fenêtre de contexte qui s'agrandit, mais le problème du "Lost in the Middle" n'a nulle part disparu. Quand il y a trop de données, le modèle commence à se confondre, ignore les détails importants du milieu du texte et produit une bouillie superficielle au lieu d'une analyse profonde.

C'est un cas classique où la quantité ne se transforme pas en qualité, et les ingénieurs ont passé des années à essayer de résoudre cela en augmentant simplement la mémoire vive.

Un groupe de chercheurs a décidé d'aborder la question différemment et a présenté FS-Researcher. Au lieu de fourrer des centaines de pages de résultats de recherche dans un modèle malheureux, ils lui ont donné une prothèse cognitive sous la forme d'un carnet structuré. L'idée est simple jusqu'au génie : l'agent ne cherche pas simplement et ne lit pas, il prend activement des notes.

Au cours du processus de travail, le système met en évidence les entités clés, les faits et les connexions, les écrivant dans un stockage externe qui est constamment mis à jour. Cela permet au modèle de maintenir son attention sur la tâche sans surcharger le contexte principal avec des déchets qui apparaissent inévitablement lors de recherches approfondies sur le web.

Autrefois, nous nous appuyions sur RAG—un système qui extrait des passages de texte d'une base de données. Mais RAG fonctionne souvent comme un mauvais bibliothécaire : il apporte la bonne page mais ne comprend pas l'image globale. FS-Researcher fonctionne comme un analyste réfléchi.

Il organise les informations de manière hiérarchique, filtre les doublons et, surtout, sait comment connecter les faits trouvés dans différentes sources. Si un document parle de la cause d'un événement et un autre de ses conséquences, le système ne se contente pas de copier les deux paragraphes, mais les synthétise en une seule chaîne logique dans son carnet. C'est absolument crucial pour rédiger des rapports longs, où non seulement la factualité compte, mais aussi la structure du récit.

Pourquoi est-ce important maintenant ? Nous avons atteint le plafond de la "force brute" des fenêtres de contexte. Des entreprises comme Google se vantent de millions de tokens dans Gemini, mais en pratique, utiliser une fenêtre aussi énorme coûte une somme folle d'argent et ralentit la génération à des vitesses d'escargot.

FS-Researcher montre que les décisions architecturales et le flux de travail correct de l'agent sont beaucoup plus efficaces que l'expansion infinie des paramètres. Pour l'entreprise, cela signifie que l'analyse automatisée de qualité des marchés ou des tendances technologiques devient moins chère et plus précise. Vous n'avez plus besoin de vérifier chaque fait que produit le réseau de neurones, car il maintient lui-même un journal transparent de son raisonnement et de ses découvertes.

En fin de compte, nous assistons à une transition des chats IA vers les employés IA. Un chat répond simplement à une question, mais un employé est quelqu'un qui peut travailler avec les informations pendant longtemps, systématiquement, et ne pas oublier pourquoi il a ouvert le navigateur il y a dix minutes. FS-Researcher est l'une des premières étapes assurées vers la création de chercheurs autonomes qui font réellement économiser du temps aux humains au lieu d'ajouter du travail en corrigeant des erreurs.

Cela change la donne dans le monde universitaire et le secteur d'entreprise, où la précision des données prime toujours sur la vitesse de livraison. Maintenant, la question est simplement de savoir à quelle vitesse ces couches deviennent la norme pour tous les services LLM populaires.

L'essentiel : l'ère des fenêtres de contexte "gonflées" pourrait prendre fin avant même de commencer, cédant la place à des systèmes de filtrage intelligents et à des carnets externes. OpenAI et Anthropic pourront-ils mettre en œuvre ces mécanismes nativement dans leurs modèles, ou assistons-nous à un essor des plateformes d'agents tiers ?

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…