Ring trasladó el soporte de 10 regiones a Amazon Bedrock Knowledge Bases y redujo costos

Q: ¿Cuál es la fuente?

Publicado originalmente en AWS Machine Learning Blog. Hamidun News procesa y adapta los materiales con IA.

Q: ¿Cuándo se publicó?

2 may 2026. Tiempo de lectura: 3 min.

Ring trasladó su soporte global self-service a Amazon Bedrock Knowledge Bases y abandonó la infraestructura separada por regiones. La empresa filtra el…

Redacción de Hamidun News

Monitoreo de AI · AWS Machine Learning Blog

2 may 2026· 3 min

Procesado por IA desde AWS Machine Learning Blog; editado por Hamidun News

Ring trasladó el soporte de 10 regiones a Amazon Bedrock Knowledge Bases y redujo costos — Fuente: AWS Machine Learning Blog. Collage: Hamidun News.

◐ Escuchar artículo

Ring compartió cómo reestructuró su soporte al cliente global de un chatbot basado en reglas a un sistema RAG sobre Amazon Bedrock Knowledge Bases. En lugar de infraestructura separada para cada mercado, la empresa mantuvo una arquitectura centralizada, preservó la precisión regional de las respuestas y redujo los costos de escalado en 21% para cada nuevo mercado.

Por qué el bot antiguo no funcionaba

Inicialmente, el servicio de soporte de Ring dependía de un chatbot Amazon Lex con escenarios codificados permanentemente. Este enfoque funcionaba mientras las solicitudes fueran predecibles, pero rápidamente alcanzó un límite: durante cargas máximas, el 16% de las conversaciones tenía que escalarse a operadores humanos, e ingenieros pasaban cerca del 10% de su tiempo manteniendo y reparando el propio bot. Para un servicio internacional, este se convirtió en un modelo demasiado caro y lento.

El problema no era solo la traducción de la interfaz. Diferentes mercados requieren respuestas diferentes teniendo en cuenta parámetros locales: desde especificaciones del dispositivo y voltaje hasta requisitos de certificación y conformidad regulatoria. Ring ya operaba en Reino Unido, Alemania y ocho regiones más, y mantener infraestructura separada para cada mercado significaba aumentar costos y complejidad operativa casi linealmente.

Cómo construyeron la nueva arquitectura

En la nueva arquitectura, Ring separó el trabajo con contenido en dos flujos: ingesta y evaluación por separado, promoción a producción por separado. El equipo de contenido carga instrucciones, guías y artículos de soporte en Amazon S3 en formato estructurado, donde cada documento tiene metadatos incluyendo `contentLocale`. Luego, AWS Lambda distribuye automáticamente el contenido bruto y metadatos extraídos a los buckets apropiados, y Step Functions construye una nueva versión de la base de conocimiento cada día.

El contenido se carga en S3 con metadatos de locale y tipo de documento
Lambda archiva el archivo bruto y guarda datos limpios para indexación
Step Functions crea una nueva versión de Knowledge Base diariamente
Los conjuntos de datos de evaluación ejecutan consultas contra versiones y comparan la calidad de los resultados
La mejor versión va a la Golden Data Source para producción

Este pipeline permitió a Ring actualizar el conocimiento sin despliegue manual y sin riesgo de romper producción. Cada versión diaria existe como una base de conocimiento separada, por lo que puede ser probada y revertida independientemente. El historial se mantiene hasta 30 días — esto es suficiente porque el contenido cambia aproximadamente 200 veces por semana.

Para verificaciones automáticas de calidad, Ring usa Anthropic Claude Sonnet 4 como juez: compara versiones en precisión de búsqueda, calidad de respuesta y métricas para cada locale.

Cómo el bot elige una respuesta

En el lado del usuario, la arquitectura también es igualmente pragmática. El cliente envía una pregunta al chatbot junto con el mercado, por ejemplo `en-GB`. Lambda no busca en toda la base de datos a ciegas, sino que aplica un filtro impulsado por metadatos en el campo `contentLocale` para que la consulta vaya directamente solo al corpus regional relevante. Después de eso, el sistema recupera los fragmentos encontrados de la versión Golden verificada, los ordena por puntuación, ensambla un prompt expandido y lo envía al modelo Amazon Bedrock para la respuesta final.

Ring señala por separado que el requisito de latencia de respuesta completa era de 7–8 segundos, y el análisis mostró un hallazgo importante: la latencia entre regiones representaba menos del 10% del tiempo total de respuesta. Esto permitió no duplicar toda la arquitectura en cada región sino mantener un único centro de procesamiento de solicitudes.

Para almacenamiento vectorial, la empresa utiliza Amazon OpenSearch Serverless, y para embeddings — Amazon Titan Embeddings con chunking estándar. El sistema está planeado para evolucionar hacia un enfoque agentic, donde agentes especializados separados serán responsables de diagnóstico de dispositivos, gestión de pedidos y recomendaciones de productos.

Lo que esto significa

El caso de Ring es útil no como una vitrina de AWS, sino como una plantilla de trabajo para cualquier empresa con soporte internacional. La idea principal es simple: no crear sistemas RAG separados por país sino mantener una única base de datos con filtrado estricto de metadatos, evaluación diaria de nuevas versiones y un mecanismo claro para promoción a producción. Esto reduce los costos de escalado, simplifica el mantenimiento y hace las respuestas más predecibles en cada mercado.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita