AWS ensina Strands Agents a trabalhar com qualquer modelo no SageMaker
A AWS publicou um guia para criar parsers customizados para o framework Strands Agents, permitindo integrar qualquer LLM implantado no SageMaker AI…
Processado por IA de AWS Machine Learning Blog; editado por Hamidun News
O mundo corporativo de agentes de IA está vivenciando um momento que pode ser comparado ao surgimento de adaptadores universais para eletrônicos: Amazon Web Services mostrou como fazer seu framework de agentes Strands Agents funcionar literalmente com qualquer modelo de linguagem implantado no SageMaker, mesmo que esse modelo não tenha a menor ideia sobre a API padrão da plataforma Bedrock.
Para entender a importância desse passo, precisamos voltar alguns meses atrás. AWS lançou Strands Agents como um framework aberto para criar agentes de IA — programas capazes de planejar ações independentemente, usar ferramentas e resolver tarefas multi-etapas. O framework foi inicialmente projetado para modelos disponíveis através do Amazon Bedrock, o que criou um ecossistema conveniente, mas fechado. Empresas que queriam usar seus próprios modelos fine-tuned ou LLMs abertos como Llama, implantados em endpoints do SageMaker AI, se viam diante de uma parede de incompatibilidade de formatos.
Novas orientações, publicadas no blog AWS Machine Learning, resolvem exatamente esse problema. Engenheiros da Amazon descrevem em detalhes o processo de criação dos chamados parsers de modelo customizados — camadas intermediárias que traduzem requisições do Strands Agents para um formato compreensível por um modelo específico, e reciprocamente transformam as respostas do modelo de volta para a estrutura esperada pelo framework. Essencialmente, é um tradutor entre dois sistemas que falam linguagens diferentes.
Como exemplo prático, AWS demonstra a implantação do Llama 3.1 usando SGLang — um mecanismo de inferência de alto desempenho para modelos de linguagem — na infraestrutura SageMaker. Para simplificar o processo de containerização, usa-se a ferramenta ml-container-creator do AWS Labs, que automatiza a criação de containers Docker para modelos de ML. Após implantar o modelo, o desenvolvedor implementa um parser customizado que intercepta chamadas do Strands Agents, reformata-as da Bedrock Messages API para um formato compatível com o endpoint SGLang, obtém a resposta e a transforma de volta. Tecnicamente isso não é ciência de foguete, mas sem documentação clara e exemplos, o processo poderia se transformar em dias de depuração.
Por que isso é realmente importante? Porque no ambiente corporativo um modelo raramente resolve todas as tarefas. Empresas treinam modelos especializados com seus próprios dados, experimentam com arquiteturas abertas, combinam múltiplos modelos em um único fluxo de trabalho. Até agora, usar tais modelos em cenários de agentes na AWS exigia ou mudar para formatos compatíveis com Bedrock, ou escrever orquestração customizada do zero. Agora existe uma forma padronizada de conectar praticamente qualquer LLM ao framework de agentes, preservando todas as vantagens do Strands — gerenciamento de ferramentas, cadeias de raciocínio, tratamento de erros.
Esse passo se encaixa na estratégia mais ampla da AWS de transformar sua plataforma ML no ecossistema mais aberto possível. Amazon claramente percebeu que tentar trancafiar clientes dentro do Bedrock é contraproducente em um mundo onde novos modelos abertos aparecem a cada semana e corporações investem cada vez mais em suas próprias soluções fine-tuned. Em vez de competir com cada novo modelo, AWS oferece infraestrutura onde qualquer coisa pode rodar, e agora — um framework de agentes que sabe trabalhar com esse "qualquer coisa."
Vale notar o contexto competitivo. Google com Vertex AI Agent Builder e Microsoft com AutoGen e Semantic Kernel estão desenvolvendo ativamente suas próprias plataformas de agentes. No entanto, a abordagem da AWS com parsers customizados abertos parece mais flexível: em vez de ditar quais modelos usar, Amazon fornece ferramentas para integrar qualquer um. Isso pode se tornar o argumento decisivo para clientes enterprise que não querem depender de um único fornecedor de modelos.
Olhando para o futuro, podemos esperar o surgimento de parsers prontos para modelos abertos populares e mecanismos de inferência — a comunidade certamente começará a criar uma biblioteca de configurações compatíveis. Para o mercado de agentes de IA, isso significa mais um passo rumo à maturidade: a tecnologia para de ser privilégio de quem usa um modelo específico de um provedor específico, e se torna disponível para qualquer time pronto para implantar um LLM em infraestrutura de nuvem.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.