AWS Machine Learning Blog→ original

Ring migrou o suporte de 10 regiões para o Amazon Bedrock Knowledge Bases e reduziu custos

A Ring migrou seu suporte global self-service para o Amazon Bedrock Knowledge Bases e abandonou a infraestrutura separada por região. A empresa filtra o…

Processado por IA de AWS Machine Learning Blog; editado por Hamidun News
Ring migrou o suporte de 10 regiões para o Amazon Bedrock Knowledge Bases e reduziu custos
Fonte: AWS Machine Learning Blog. Colagem: Hamidun News.
◐ Ouvir artigo

A Ring compartilhou como reestruturou seu suporte ao cliente global de um chatbot baseado em regras para um sistema RAG sobre Amazon Bedrock Knowledge Bases. Em vez de infraestrutura separada para cada mercado, a empresa manteve uma arquitetura centralizada, preservou a precisão regional das respostas e reduziu os custos de expansão em 21% para cada novo mercado.

Por que o bot antigo não funcionava

Inicialmente, o serviço de suporte da Ring dependia de um chatbot Amazon Lex com cenários codificados permanentemente. Essa abordagem funcionava enquanto as solicitações permanecessem previsíveis, mas rapidamente atingiu um teto: durante picos de carga, 16% das conversas precisavam ser escaladas para operadores humanos, e os engenheiros passavam cerca de 10% do seu tempo suportando e corrigindo o próprio bot. Para um serviço internacional, esse se tornou um modelo muito caro e lento.

O problema não era apenas a tradução da interface. Diferentes mercados requerem respostas diferentes levando em conta parâmetros locais: desde especificações do dispositivo e tensão até requisitos de certificação e conformidade regulatória. A Ring já operava no Reino Unido, Alemanha e oito outras regiões, e manter infraestrutura separada para cada mercado significava aumentar custos e complexidade operacional quase linearmente.

Como construíram a nova arquitetura

Na nova arquitetura, a Ring separou o trabalho com conteúdo em dois fluxos: ingestão e avaliação separadamente, promoção para produção separadamente. O time de conteúdo carrega instruções, guias e artigos de suporte para Amazon S3 em formato estruturado, onde cada documento tem metadados incluindo `contentLocale`. Depois, AWS Lambda distribui automaticamente o conteúdo bruto e metadados extraídos aos buckets apropriados, e Step Functions constrói uma nova versão da base de conhecimento a cada dia.

  • Conteúdo é carregado em S3 com metadados de localidade e tipo de documento
  • Lambda arquiva o arquivo bruto e salva dados limpos para indexação
  • Step Functions cria uma nova versão da Knowledge Base diariamente
  • Conjuntos de dados de avaliação executam consultas contra versões e comparam a qualidade da saída
  • A melhor versão vai para a Golden Data Source para produção

Esse pipeline permitiu que a Ring atualizasse conhecimento sem implantação manual e sem risco de prejudicar a produção. Cada versão diária existe como uma base de conhecimento separada, então pode ser testada e revertida independentemente. O histórico é mantido por até 30 dias — isso é suficiente porque o conteúdo muda aproximadamente 200 vezes por semana.

Para verificações automáticas de qualidade, a Ring usa Anthropic Claude Sonnet 4 como juiz: compara versões em precisão de busca, qualidade de resposta e métricas para cada localidade.

Como o bot escolhe uma resposta

Do lado do usuário, a arquitetura também é igualmente pragmática. O cliente envia uma pergunta para o chatbot junto com o mercado, por exemplo `en-GB`. Lambda não busca em toda a base de dados cegamente, mas aplica um filtro orientado por metadados no campo `contentLocale` para que a consulta vá diretamente apenas para o corpus regional relevante. Depois disso, o sistema recupera os fragmentos encontrados da versão Golden verificada, ordena-os por score, monta um prompt expandido e o envia para o modelo Amazon Bedrock para a resposta final.

A Ring observa separadamente que o requisito de latência completa de resposta era de 7–8 segundos, e a análise mostrou uma descoberta importante: latência entre regiões respondeu por menos de 10% do tempo total de resposta. Isso tornava possível não duplicar toda a arquitetura em cada região, mas manter um único centro de processamento de requisições.

Para armazenamento vetorial, a empresa usa Amazon OpenSearch Serverless, e para embeddings — Amazon Titan Embeddings com chunking padrão. O sistema está planejado para evoluir em direção a uma abordagem agentic, onde agentes especializados separados serão responsáveis por diagnóstico de dispositivos, gerenciamento de pedidos e recomendações de produtos.

O que isso significa

O caso da Ring é útil não como uma vitrine da AWS, mas como um template funcional para qualquer empresa com suporte internacional. A ideia principal é simples: não criar sistemas RAG separados por país, mas manter um único banco de dados com filtragem rigorosa de metadados, avaliação diária de novas versões e um mecanismo claro para promoção para produção. Isso reduz custos de expansão, simplifica a manutenção e torna as respostas mais previsíveis em cada mercado.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…