AWS a créé NarrateAI — un assistant pour l'analyse commerciale sur Amazon Bedrock AgentCore
AWS a présenté l'architecture de NarrateAI — un assistant conversationnel pour l'intelligence commerciale sur Amazon Bedrock AgentCore. Le système utilise…
Traité par IA depuis AWS Machine Learning Blog ; édité par Hamidun News
AWS a présenté l'architecture de NarrateAI — un assistant conversationnel basé sur Amazon Bedrock AgentCore, qui aide la division SMGS (Sales, Marketing and Global Services) à mettre à l'échelle l'analyse commerciale. Le système combine le traitement par lot et l'interaction en temps réel pour fournir des insights à l'échelle organisationnelle.
Architecture à deux niveaux
NarrateAI est construite sur la séparation du traitement en deux couches indépendantes. La première couche exécute les tâches par lot : préparation des données, calcul des métriques, mise en cache des résultats. Cela assure un débit élevé et économise les ressources informatiques.
La couche par lot fonctionne de manière asynchrone, en parallélisant le traitement de grands ensembles de données. La deuxième couche traite les requêtes en temps réel des utilisateurs : interaction conversationnelle, redirection vers les agents appropriés, validation des données d'entrée. Elle est responsable de la latence et de la qualité de la réponse au moment de la requête.
Amazon Bedrock AgentCore permet de gérer plus efficacement l'orchestration entre les couches et l'exécution parallèle des agents spécialisés. Cette séparation est critique pour la mise à l'échelle : la couche par lot gère le volume croissant de données, la couche en temps réel maintient la latence sous contrôle et ne bloque pas les calculs longs.
Agents spécialisés
Au lieu d'un assistant monolithique, AWS utilise un réseau d'agents spécialisés, chacun ayant sa propre zone de responsabilité. L'agent de validation vérifie la validité et la complétude de la requête entrante avant la transmission au pipeline principal. L'agent de routage détermine vers quelle division SMGS (ventes, marketing, services mondiaux) diriger la requête, en tenant compte du contexte. Les agents de connaissance fournissent un contexte spécifique à chaque division : métriques, tendances historiques, processus internes. L'agent de synthèse combine les réponses de différentes sources en une recommandation cohérente que l'utilisateur voit. Cette architecture réduit le taux d'erreurs, augmente la pertinence des réponses, simplifie l'ajout de nouveaux agents et facilite le débogage.
Modèles d'ingénierie pour la production
AWS souligne plusieurs pratiques qui ont permis de déployer NarrateAI à grande échelle :
- Dégradation gracieuse — si un agent n'est pas disponible, le système propose une réponse alternative au lieu d'une erreur
- Suivi des coûts — chaque agent suit le coût du traitement, le système optimise les routes
- Observabilité dans la chaîne des agents — journalisation, traçage, surveillance de la latence à chaque nœud
- Limitation de débit et priorisation — la couche par lot ne bloque pas les requêtes en temps réel, les files d'attente sont séparées
- Mise en cache des réponses des agents pour les requêtes fréquentes
Ces modèles ont aidé AWS à atteindre une haute fiabilité et un comportement prévisible en production.
Ce que cela signifie
L'article montre que les systèmes IA de qualité production nécessitent non seulement des LLM, mais aussi une architecture capable de gérer l'échelle, la latence et la fiabilité. Les agents spécialisés, le traitement à deux niveaux, la dégradation gracieuse — ce sont des pratiques que d'autres entreprises peuvent appliquer avec Amazon Bedrock. Pour les développeurs, cela signifie que l'orchestration IA devient une couche distincte entre le LLM et la logique métier.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.