AWS Machine Learning Blog→ original

AWS muestra cómo construir agentes de IA en SageMaker y probar modelos a través de MLflow

AWS lanzó un desglose práctico sobre construcción de agentes de IA con Strands Agents SDK y modelos implementados en SageMaker. La configuración incluye…

Procesado por IA desde AWS Machine Learning Blog; editado por Hamidun News
AWS muestra cómo construir agentes de IA en SageMaker y probar modelos a través de MLflow
Fuente: AWS Machine Learning Blog. Collage: Hamidun News.
◐ Escuchar artículo

El 27 de abril de 2026, AWS publicó un desglose práctico de cómo ejecutar agentes de IA en su propia infraestructura gestionada, no solo en servicios completamente gestionados. La empresa demostró una combinación de Strands Agents SDK, SageMaker AI y Serverless MLflow, donde un agente puede ser rápidamente montado, implementado en un endpoint, observar su comportamiento en producción y comparar varias variantes de modelo sin cambiar la arquitectura general. Para equipos que priorizan control, costos predecibles y requisitos de seguridad, esto parece un intento de transformar sistemas de agentes de una capa experimental en un proceso normal de MLOps.

En el corazón del enfoque está el SDK de Strands Agents, un framework de código abierto para construir agentes a partir de un modelo, prompt y conjunto de herramientas. En el ejemplo de AWS, primero muestra un escenario básico con un modelo en Bedrock, luego transfiere la misma idea a modelos ejecutándose en SageMaker AI. El punto clave es que Strands puede trabajar con endpoints de inferencia de SageMaker como proveedor de modelo si es compatible con una API de completamiento de chat compatible con OpenAI.

La demostración utiliza dos versiones de Qwen3 de SageMaker JumpStart — 4B y 8B. La primera se implementa como el endpoint principal, después de lo cual el agente obtiene acceso a herramientas como solicitudes HTTP y una calculadora, y puede ejecutar tareas típicas en su propia infraestructura de modelo.

¿Por qué trasladar la lógica del agente a SageMaker si hay APIs listas en el mercado? AWS apuesta por cuatro argumentos. Primero — control de infraestructura: puedes elegir con precisión instancias, configuraciones de red y reglas de escalado para la latencia y SLA requeridos. Segundo — flexibilidad con modelos: además de foundation models listos, puedes usar variantes personalizadas o ajustadas, así como modelos de código abierto. Tercero — economía más predecible para grandes cargas de trabajo a través de endpoints dedicados y ajuste preciso de recursos. Cuarto — un marco enterprise adecuado alrededor de los agentes: trazabilidad, versionado, pruebas A/B y auditoría, que se necesitan no en demostraciones sino en producción.

AWS enfatiza por separado la observabilidad. Para esto se utiliza MLflow sin servidor SageMaker AI: el servicio escribe automáticamente trazas de ejecución, pasos del agente, llamadas de herramientas y métricas, sin obligar al equipo a instrumentar manualmente el código con telemetría personalizada. Después de habilitar autolog, los datos fluyen a la interfaz MLflow, donde puede ver la lista de ejecuciones, expandir un trace específico, ver el Agent Loop, un árbol de spans, entradas y salidas de cada paso.

Esto es importante no solo para la depuración. Este nivel de transparencia es necesario cuando un agente comienza a tomar decisiones en procesos comerciales sensibles, y el equipo necesita entender exactamente dónde falló, por qué eligió una herramienta específica y cómo cambia su comportamiento después de una actualización del modelo.

La parte más práctica del material es la prueba A/B entre variantes de modelos. AWS muestra cómo adjuntar dos variaciones de producción al mismo endpoint, en el ejemplo Qwen3 4B y Qwen3 8B, y dividir inicialmente el tráfico entre ellos 50/50. Después de eso, puede comparar respuestas en el flujo en vivo o crear dos agentes separados, cada uno mirando su propia variante objetivo.

A continuación, se conecta la evaluación MLflow GenAI: el equipo recopila un conjunto único de casos de prueba, establece expectativas para hechos y herramientas utilizadas, luego ejecuta ambas variantes a través de los mismos scorers. El ejemplo utiliza tanto controles determinísticos como métricas LLM-as-a-judge como corrección y relevancia. Este escenario convierte la selección del modelo de un debate sobre sentimientos en un procedimiento reproducible: la nueva versión no solo parece más inteligente, sino que pasa las mismas pruebas, después de lo cual puede hacerse gradualmente el predeterminado cambiando pesos.

La conclusión es simple: AWS no está vendiendo otro SDK de agente, sino un marco de ingeniería en el que un agente se convierte en un componente de producto gestionado. Si las empresas necesitan sus propios modelos, su propio perímetro, auditoría de acciones del agente e implementación cuidadosa de nuevas versiones, la combinación de Strands, SageMaker y MLflow aborda este escenario mucho más cercano a la realidad empresarial que muchas pilas de demostración rápidas. Para el mercado, esta es otra señal de que la próxima competencia en IA ya no es solo sobre la calidad del modelo, sino sobre la calidad de la infraestructura que la rodea.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…