AWS Machine Learning Blog→ original

Ring a transféré le support de 10 régions vers Amazon Bedrock Knowledge Bases et a réduit ses coûts

Ring a transféré son support global en self-service vers Amazon Bedrock Knowledge Bases et a abandonné une infrastructure distincte par région. L’entreprise…

Traité par IA depuis AWS Machine Learning Blog ; édité par Hamidun News
Ring a transféré le support de 10 régions vers Amazon Bedrock Knowledge Bases et a réduit ses coûts
Source : AWS Machine Learning Blog. Collage: Hamidun News.
◐ Écouter l'article

Ring a partagé comment elle a restructuré son support client mondial d'un chatbot basé sur des règles vers un système RAG au-dessus d'Amazon Bedrock Knowledge Bases. Au lieu d'une infrastructure séparée pour chaque marché, l'entreprise a maintenu une architecture centralisée, préservé la précision régionale des réponses et réduit les coûts de mise à l'échelle de 21% pour chaque nouveau marché.

Pourquoi l'ancien bot ne fonctionnait pas

Initialement, le service d'assistance de Ring reposait sur un chatbot Amazon Lex avec des scénarios codés en dur. Cette approche fonctionnait tant que les demandes restaient prévisibles, mais a rapidement atteint un plafond : lors des pics de charge, 16% des conversations devaient être transférées à des opérateurs humains, et les ingénieurs passaient environ 10% de leur temps à soutenir et corriger le bot lui-même. Pour un service international, ce devenu un modèle beaucoup trop coûteux et lent.

Le problème n'était pas seulement la traduction de l'interface. Différents marchés nécessitent des réponses différentes tenant compte des paramètres locaux : des spécifications des appareils et de la tension aux exigences de certification et de conformité réglementaire. Ring opérait déjà au Royaume-Uni, en Allemagne et dans huit autres régions, et maintenir une infrastructure séparée pour chaque marché signifiait augmenter les coûts et la complexité opérationnelle presque linéairement.

Comment ils ont construit la nouvelle architecture

Dans la nouvelle architecture, Ring a séparé le travail avec le contenu en deux boucles : ingestion et évaluation séparément, promotion en production séparément. L'équipe de contenu télécharge des instructions, des guides et des articles d'assistance sur Amazon S3 dans un format structuré, où chaque document a des métadonnées incluant `contentLocale`. Ensuite, AWS Lambda distribue automatiquement le contenu brut et les métadonnées extraits aux buckets appropriés, et Step Functions construit une nouvelle version de la base de connaissances chaque jour.

  • Le contenu est téléchargé sur S3 avec les métadonnées de locale et de type de document
  • Lambda archive le fichier brut et sauvegarde les données nettoyées pour l'indexation
  • Step Functions crée une nouvelle version de Knowledge Base quotidiennement
  • Les ensembles de données d'évaluation exécutent des requêtes par rapport aux versions et comparent la qualité des résultats
  • La meilleure version va dans la Golden Data Source pour la production

Ce pipeline a permis à Ring de mettre à jour les connaissances sans déploiement manuel et sans risque de casser la production. Chaque version quotidienne existe comme une base de connaissances séparée, elle peut donc être testée et restaurée indépendamment. L'historique est conservé jusqu'à 30 jours — c'est suffisant car le contenu change environ 200 fois par semaine.

Pour les vérifications automatiques de qualité, Ring utilise Anthropic Claude Sonnet 4 en tant que juge : elle compare les versions sur la précision de la recherche, la qualité des réponses et les métriques pour chaque locale.

Comment le bot choisit une réponse

Du côté de l'utilisateur, l'architecture est tout aussi pragmatique. Le client envoie une question au chatbot avec le marché, par exemple `en-GB`. Lambda ne recherche pas dans toute la base de données à l'aveugle, mais applique un filtre piloté par métadonnées sur le champ `contentLocale` pour que la requête aille directement uniquement au corpus régional pertinent. Après cela, le système récupère les fragments trouvés de la version Golden vérifiée, les trie par score, assemble une invite étendue et l'envoie au modèle Amazon Bedrock pour la réponse finale.

Ring note séparément que l'exigence de latence de réponse complète était de 7–8 secondes, et l'analyse a montré une constatation importante : la latence inter-régionale représentait moins de 10% du temps de réponse total. Cela a permis de ne pas dupliquer toute l'architecture dans chaque région mais de maintenir un unique centre de traitement des requêtes.

Pour le stockage vectoriel, l'entreprise utilise Amazon OpenSearch Serverless, et pour les embeddings — Amazon Titan Embeddings avec chunking standard. Le système est prévu pour évoluer vers une approche agentic, où des agents spécialisés séparés seront responsables du diagnostic des appareils, de la gestion des commandes et des recommandations de produits.

Ce que cela signifie

Le cas de Ring est utile non pas comme une vitrine d'AWS, mais comme un modèle fonctionnel pour toute entreprise disposant d'un support international. L'idée principale est simple : ne pas créer de systèmes RAG séparés par pays mais maintenir une seule base de données avec un filtrage strict des métadonnées, une évaluation quotidienne des nouvelles versions et un mécanisme clair de promotion en production. Cela réduit les coûts de mise à l'échelle, simplifie la maintenance et rend les réponses plus prévisibles sur chaque marché.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…