AWS Machine Learning Blog→ original

AWS apprend à Strands Agents à travailler avec n'importe quel modèle sur SageMaker

AWS a publié un guide pour créer des parseurs personnalisés pour le framework Strands Agents, permettant d'intégrer n'importe quel LLM déployé sur SageMaker…

Traité par IA depuis AWS Machine Learning Blog ; édité par Hamidun News
AWS apprend à Strands Agents à travailler avec n'importe quel modèle sur SageMaker
Source : AWS Machine Learning Blog. Collage: Hamidun News.
◐ Écouter l'article

Le monde corporatif des agents d'IA connaît un moment qui peut être comparé à l'apparition d'adaptateurs universels pour l'électronique : Amazon Web Services a montré comment faire fonctionner son framework d'agents Strands Agents littéralement avec n'importe quel modèle de langage déployé sur SageMaker, même si ce modèle n'a aucune idée de l'API standard de la plateforme Bedrock.

Pour comprendre l'importance de cette étape, nous devons revenir quelques mois en arrière. AWS a lancé Strands Agents en tant que framework ouvert pour créer des agents d'IA — des programmes capables de planifier indépendamment des actions, d'utiliser des outils et de résoudre des tâches multi-étapes. Le framework était initialement conçu pour les modèles disponibles via Amazon Bedrock, ce qui créait un écosystème pratique mais fermé. Les entreprises qui voulaient utiliser leurs propres modèles fine-tuned ou des LLM ouverts comme Llama, déployés sur des endpoints SageMaker AI, se trouvaient face à un mur d'incompatibilité de formats.

Les nouvelles directives, publiées sur le blog AWS Machine Learning, résolvent exactement ce problème. Les ingénieurs d'Amazon décrivent en détail le processus de création des soi-disant parseurs de modèles personnalisés — des couches intermédiaires qui traduisent les demandes de Strands Agents dans un format compréhensible par un modèle spécifique, et inversement transforment les réponses du modèle dans la structure attendue par le framework. En essence, c'est un traducteur entre deux systèmes parlant des langages différents.

Comme exemple pratique, AWS démontre le déploiement de Llama 3.1 en utilisant SGLang — un moteur d'inférence haute performance pour les modèles de langage — sur l'infrastructure SageMaker. Pour simplifier le processus de containerisation, l'outil ml-container-creator d'AWS Labs est utilisé, qui automatise la création de conteneurs Docker pour les modèles ML. Après avoir déployé le modèle, le développeur met en œuvre un parseur personnalisé qui intercepte les appels de Strands Agents, les reformate de Bedrock Messages API vers un format compatible avec l'endpoint SGLang, reçoit la réponse et la retransforme. Techniquement, ce n'est pas de la science-fiction, mais sans documentation claire et exemples, le processus aurait pu se transformer en jours de débogage.

Pourquoi est-ce vraiment important ? Parce que dans l'environnement corporatif, un modèle résout rarement toutes les tâches. Les entreprises entraînent des modèles spécialisés sur leurs propres données, expérimentent avec des architectures ouvertes, combinent plusieurs modèles dans un flux de travail unique. Jusqu'à présent, utiliser tels modèles dans des scénarios d'agents sur AWS nécessitait soit de passer à des formats compatibles avec Bedrock, soit d'écrire une orchestration personnalisée à partir de zéro. Il existe maintenant une façon standardisée de connecter pratiquement n'importe quel LLM au framework d'agents, tout en préservant tous les avantages de Strands — gestion des outils, chaînes de raisonnement, gestion des erreurs.

Cette étape s'inscrit dans la stratégie plus large d'AWS visant à transformer sa plateforme ML en l'écosystème le plus ouvert possible. Amazon a clairement réalisé que tenter de verrouiller les clients dans Bedrock est contre-productif dans un monde où de nouveaux modèles ouverts apparaissent chaque semaine et où les corporations investissent de plus en plus dans leurs propres solutions fine-tuned. Au lieu de concourir avec chaque nouveau modèle, AWS offre une infrastructure sur laquelle n'importe quoi peut fonctionner, et maintenant — un framework d'agents qui sait travailler avec ce « n'importe quoi ».

Il vaut la peine de noter le contexte concurrentiel. Google avec Vertex AI Agent Builder et Microsoft avec AutoGen et Semantic Kernel développent activement leurs propres plateformes d'agents. Cependant, l'approche d'AWS avec des parseurs personnalisés ouverts semble plus flexible : au lieu de dicter quels modèles utiliser, Amazon fournit des outils pour intégrer n'importe lequel. Cela pourrait devenir l'argument décisif pour les clients d'entreprise qui ne veulent pas dépendre d'un seul fournisseur de modèles.

En regardant vers l'avant, nous pouvons nous attendre à l'émergence de parseurs prêts à l'emploi pour les modèles ouverts populaires et les moteurs d'inférence — la communauté commencera sûrement à créer une bibliothèque de configurations compatibles. Pour le marché des agents d'IA, cela signifie une autre étape vers la maturité : la technologie cesse d'être le privilège de ceux utilisant un modèle spécifique d'un fournisseur spécifique, et devient disponible pour toute équipe prête à déployer un LLM sur une infrastructure cloud.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…