AWS Machine Learning Blog→ original

AWS enseña a Strands Agents a trabajar con cualquier modelo en SageMaker

AWS publicó una guía para crear parsers personalizados para el framework Strands Agents, lo que permite integrar cualquier LLM desplegado en SageMaker AI…

Procesado por IA desde AWS Machine Learning Blog; editado por Hamidun News
AWS enseña a Strands Agents a trabajar con cualquier modelo en SageMaker
Fuente: AWS Machine Learning Blog. Collage: Hamidun News.
◐ Escuchar artículo

El mundo corporativo de los agentes de IA está experimentando un momento que puede compararse con la aparición de adaptadores universales para electrónica: Amazon Web Services ha mostrado cómo hacer que su framework de agentes Strands Agents funcione literalmente con cualquier modelo de lenguaje implementado en SageMaker, incluso si ese modelo no tiene ni idea sobre la API estándar de la plataforma Bedrock.

Para entender la importancia de este paso, necesitamos retroceder algunos meses. AWS lanzó Strands Agents como un framework abierto para crear agentes de IA — programas capaces de planificar acciones de forma independiente, utilizar herramientas y resolver tareas multi-etapa. El framework fue inicialmente diseñado para modelos disponibles a través de Amazon Bedrock, lo que creó un ecosistema conveniente pero cerrado. Las empresas que querían usar sus propios modelos fine-tuned o LLMs abiertos como Llama, implementados en endpoints de SageMaker AI, se encontraban ante una pared de incompatibilidad de formatos.

Las nuevas orientaciones, publicadas en el blog AWS Machine Learning, resuelven exactamente este problema. Los ingenieros de Amazon describen en detalle el proceso de creación de los llamados analizadores de modelo personalizados — capas intermedias que traducen solicitudes de Strands Agents a un formato comprensible por un modelo específico, e inversamente transforman las respuestas del modelo de vuelta a la estructura esperada por el framework. Esencialmente, es un traductor entre dos sistemas que hablan idiomas diferentes.

Como ejemplo práctico, AWS demuestra la implementación de Llama 3.1 utilizando SGLang — un motor de inferencia de alto rendimiento para modelos de lenguaje — en infraestructura SageMaker. Para simplificar el proceso de containerización, se utiliza la herramienta ml-container-creator de AWS Labs, que automatiza la creación de contenedores Docker para modelos de ML. Después de implementar el modelo, el desarrollador implementa un analizador personalizado que intercepta llamadas de Strands Agents, las reformatea de Bedrock Messages API a un formato compatible con el endpoint de SGLang, obtiene la respuesta y la transforma de vuelta. Técnicamente esto no es ciencia de cohetes, pero sin documentación clara y ejemplos, el proceso podría convertirse en días de depuración.

¿Por qué es realmente importante esto? Porque en el entorno corporativo un modelo rara vez resuelve todas las tareas. Las empresas entrenan modelos especializados con sus propios datos, experimentan con arquitecturas abiertas, combinan múltiples modelos en un flujo de trabajo único. Hasta ahora, usar tales modelos en escenarios de agentes en AWS requería o bien cambiar a formatos compatibles con Bedrock, o escribir orquestración personalizada desde cero. Ahora existe una forma estandarizada de conectar prácticamente cualquier LLM al framework de agentes, preservando todas las ventajas de Strands — gestión de herramientas, cadenas de razonamiento, manejo de errores.

Este paso se ajusta a la estrategia más amplia de AWS de convertir su plataforma ML en el ecosistema más abierto posible. Amazon claramente se dio cuenta de que intentar encerrar a los clientes dentro de Bedrock es contraproducente en un mundo donde nuevos modelos abiertos aparecen cada semana y las corporaciones invierten cada vez más en sus propias soluciones fine-tuned. En lugar de competir con cada nuevo modelo, AWS ofrece infraestructura donde puede ejecutarse cualquier cosa, y ahora — un framework de agentes que sabe trabajar con ese "cualquier cosa."

Vale la pena notar el contexto competitivo. Google con Vertex AI Agent Builder y Microsoft con AutoGen y Semantic Kernel están desarrollando activamente sus propias plataformas de agentes. Sin embargo, el enfoque de AWS con analizadores personalizados abiertos se ve más flexible: en lugar de dictar qué modelos usar, Amazon proporciona herramientas para integrar cualquiera. Esto podría convertirse en el argumento decisivo para clientes empresariales que no quieren depender de un único proveedor de modelos.

Mirando hacia adelante, podemos esperar la aparición de analizadores listos para modelos abiertos populares y motores de inferencia — la comunidad seguramente comenzará a crear una biblioteca de configuraciones compatibles. Para el mercado de agentes de IA, esto significa otro paso hacia la madurez: la tecnología deja de ser privilegio de quienes utilizan un modelo específico de un proveedor específico, y se vuelve disponible para cualquier equipo dispuesto a desplegar un LLM en infraestructura en la nube.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…