ZDNet AI→ original

Thomson Reuters énonce quatre règles pour des agents d’AI auxquels les entreprises peuvent faire confiance

Les agents d’AI s’intègrent de plus en plus aux flux de travail réels, mais la confiance qu’ils inspirent dépend moins de la puissance du modèle que du…

Traité par IA depuis ZDNet AI ; édité par Hamidun News
Thomson Reuters énonce quatre règles pour des agents d’AI auxquels les entreprises peuvent faire confiance
Source : ZDNet AI. Collage: Hamidun News.
◐ Écouter l'article

Les agents IA passent rapidement de l'expérimentation aux flux de travail, et les entreprises se posent une question clé : comment les rendre suffisamment fiables pour des tâches du monde réel ? Thomson Reuters estime que la réponse ne réside pas dans la magie des modèles, mais dans la discipline du développement, les tests et l'intégration avec les outils existants.

Comment Mesurer le Succès

Selon Joel Hron, directeur technique de Thomson Reuters Labs, la première étape consiste à définir à l'avance ce qui constitue réellement un bon résultat. Pour les systèmes d'agents, c'est plus difficile que pour les logiciels ordinaires : il ne suffit pas de vérifier qu'une réponse « semble correcte ». Vous devez décrire formellement quelles qualités font un bon résultat, où l'agent peut échouer, quels écarts l'entreprise acceptera et à quel moment une intervention humaine est nécessaire. L'entreprise utilise plusieurs niveaux d'évaluation pour ne pas dépendre d'une seule métrique ou d'un seul ensemble de tests :

  • des benchmarks publics pour l'évaluation initiale des nouveaux modèles
  • des tests internes avec des critères clairs de qualité des réponses
  • des vérifications automatisées pour des cycles de développement rapides
  • une évaluation finale par des experts du domaine

L'automatisation aide à accélérer les itérations, mais la confiance finale doit toujours passer par des personnes. Hron souligne qu'avant de lancer un produit, l'équipe souhaite une confirmation d'experts humains, et pas seulement des métriques et des tests automatisés. Pour les marchés où une erreur coûte de l'argent, du temps ou des risques juridiques, cette approche n'est pas une surprudence mais une exigence obligatoire. Sinon, un agent peut montrer d'excellents résultats de démonstration mais échouer dans le monde réel, où les nuances et le contexte professionnel comptent.

Langage Commun pour les Équipes

La deuxième conclusion de Thomson Reuters est qu'un agent ne peut pas être conçu indépendamment de l'interface et de l'expérience utilisateur. Si une entreprise veut que ses employés travaillent avec un agent comme avec un collègue numérique, ils ont besoin d'un langage commun, d'une interface intuitive et d'une logique d'interaction transparente. Les utilisateurs doivent voir non seulement le résultat, mais le raisonnement du système : quelles étapes il effectue, où il demande des données, quand il utilise des outils et quand il a besoin d'un examen humain. Sans cette transparence, l'agent est perçu comme une boîte noire, pas comme un assistant.

Cela mène à un conseil pratique : les designers, les équipes de produit et les data scientists ne doivent pas travailler dans des canaux séparés mais travailler littéralement ensemble. Hron le décrit sans romantisme—vous devez simplement asseoir les designers à côté des data scientists et les forcer à discuter régulièrement de ce qui se passe à l'intérieur de l'agent. Plus ce couplage est serré, plus vite émerge une interface qui ne cache pas la pensée du système mais la rend gérable. Pour l'entreprise, c'est aussi une protection contre la fausse autonomie, quand une belle interface masque une logique instable.

Outils et Partenaires

La troisième leçon est : n'essayez pas de construire un agent « omniscient » qui peut tout faire seul. Thomson Reuters emprunte un chemin différent : décomposer les produits existants et transformer leurs fonctions en outils vérifiés avec lesquels l'agent peut travailler. Si une entreprise dispose de dizaines d'applications matures accumulées au fil des ans, elles deviennent non pas un fardeau mais un ensemble de modules fiables pour la nouvelle architecture d'agents. Cette approche est particulièrement importante maintenant, car les modèles progressent considérablement dans la génération de code, l'exécution de plans et le raisonnement multi-étapes, mais ne peuvent toujours pas garantir la prévisibilité par eux-mêmes.

« Nous ne jouons pas à 90 %.

Nous jouons à 99 % et 99,9 % », c'est ainsi que Hron décrit la norme pour les produits d'agents IA.

Cela mène au quatrième conseil : apprendre non pas seulement au sein de votre entreprise. Thomson Reuters a lancé la Trust in AI Alliance avec Anthropic, AWS, Google Cloud et OpenAI, et développe également des partenariats avec Imperial College London. Le focus de telles initiatives est l'explicabilité, la transparence et ces « derniers neuf » de précision qui séparent un prototype impressionnant d'un produit fonctionnel. Pour les entreprises, c'est un signal : une pile d'agents ne peut pas être construite en isolation si l'objectif n'est pas seulement d'implémenter une fonctionnalité à la mode, mais de porter le système à un niveau auquel on peut faire confiance pour des décisions réelles.

Ce Que Cela Signifie

Le point principal de l'article est simple : les entreprises ne devraient pas attendre un agent parfait mythique. Les systèmes fiables sont construits à partir de critères de qualité mesurables, de collaboration étroite entre les équipes de produit et techniques, d'outils internes vérifiés et d'échange externe de pratiques. Les gagnants ne seront pas les entreprises dont l'agent semble le plus intelligent, mais celles dont le comportement de l'agent est le mieux testé, le plus compréhensible pour les utilisateurs et le plus profondément intégré au travail opérationnel réel.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…