AWS Machine Learning Blog→ original

Amazon Bedrock : des Lambda-evaluators personnalisés pour contrôler les agents IA

AWS a publié un guide sur la création d'evaluators basés sur Lambda pour Amazon Bedrock AgentCore. Ils vérifient les réponses des agents en temps réel…

Traité par IA depuis AWS Machine Learning Blog ; édité par Hamidun News
Amazon Bedrock : des Lambda-evaluators personnalisés pour contrôler les agents IA
Source : AWS Machine Learning Blog. Collage: Hamidun News.
◐ Écouter l'article

Amazon Bedrock AgentCore supporte désormais des evaluators basés sur Lambda personnalisés — des fonctions qui vérifient les réponses des agents IA à la volée avant qu'elles ne parviennent à l'utilisateur.

Que sont les evaluators dans AgentCore

Les evaluators sont des validateurs qui vérifient la qualité, la sécurité et la correction factuelle des réponses générées par l'agent. Amazon Bedrock fournit déjà des vérifications intégrées contre les hallucinations et le style, mais la nouvelle fonctionnalité permet de créer les siennes, orientées vers un domaine spécifique. Pourquoi ? Parce que les vérifications génériques ne détectent pas les erreurs spécifiques au domaine. Un agent financier doit vérifier l'authenticité des cotations. Un agent healthcare doit se conformer aux directives de la FDA. Un agent juridique doit se conformer à la législation locale.

Comment fonctionnent les Lambda-evaluators

Les evaluators personnalisés résident dans AWS Lambda et s'intègrent à AgentCore via une API. Quand l'agent génère une réponse, Bedrock l'envoie pour vérification avant de la remettre à l'utilisateur. La fonction Lambda analyse le texte et retourne un verdict : laisser passer, éditer ou bloquer. Les evaluators fonctionnent dans deux modes :

  • À la demande — vérification sur demande, à l'initiative de DevOps
  • En ligne — vérification en temps réel, intégrée dans le flux de l'agent sans délai pour l'utilisateur

Le deuxième mode est plus utile en production : le système garantit qu'une mauvaise réponse ne passe pas, mais l'utilisateur n'attend pas une vérification longue.

Quatre types de vérifications

AWS a présenté quatre fonctions Lambda pour un agent market-intelligence financier :

  • Fact-checking — comparaison de la réponse avec des sources fiables via les services AWS, par exemple DynamoDB avec des données historiques
  • Détection de PII — recherche de données personnelles (SSN, numéros de cartes de crédit, téléphones) à l'aide d'AWS Comprehend
  • Alertes en temps réel — envoi de notifications via SNS, Slack ou webhook lors de la détection de problèmes
  • Logique de domaine personnalisée — vérification du réalisme des indicateurs financiers, recherche de contradictions, validation selon les règles métier

Intégration avec l'écosystème AWS

L'agent financier combine les vérifications Lambda personnalisées avec les evaluators intégrés de Bedrock. Les vérifications intégrées détectent les hallucinations et la grammaire. Les evaluators Lambda détectent les erreurs spécifiques au domaine financier. L'intégration avec d'autres services AWS est directement possible : Lambda peut appeler AWS Comprehend, Kendra, SNS, SageMaker — tout dans un seul écosystème, sans surcharge d'intégration.

Ce que cela signifie

AWS fait un pas sérieux vers l'IA avec human-in-the-loop pour les industries régulées. Auparavant, le contrôle de qualité était soit manuel, soit nécessitait une solution propriétaire — maintenant, c'est natif dans Bedrock. Pour le secteur financier et healthcare, c'est critique : les régulateurs exigent une transparence totale, un audit de toutes les décisions et la possibilité de bloquer une réponse incorrecte avant la publication. Les Lambda-evaluators offrent exactement cela.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…