OpenAI ajoute l'exécution en sandbox au Agents SDK pour le contrôle et l'exécution sécurisée des agents IA
OpenAI a mis à jour le Agents SDK et a ajouté un sandbox natif pour l'exécution isolée des tâches d'agents. Les équipes d'entreprise peuvent exécuter des…
Traité par IA depuis AI News ; édité par Hamidun News
OpenAI essaie de combler l'une des lacunes les plus douloureuses dans les agents d'IA d'entreprise : comment donner à un modèle l'accès aux fichiers, au code et à l'environnement de travail sans en faire un risque incontrôlé pour l'entreprise. Une nouvelle mise à jour du Agents SDK ajoute l'exécution native en sandbox — une couche d'exécution isolée où un agent peut lire et écrire des fichiers, exécuter des commandes et travailler avec des dépendances sans obtenir d'accès direct à l'infrastructure sensible. Pour les équipes qui ont déjà dépassé les démonstrations et tentent d'exécuter des flux de travail agentic en production, ce n'est pas une mise à jour cosmétique, mais une tentative de résoudre trois problèmes à la fois : gouvernance, fiabilité et coût des exécutions longues.
Jusqu'à présent, les développeurs faisaient face à un choix désagréable. Les frameworks agnostiques du modèle offraient la liberté et permettaient de ne pas être lié à un seul fournisseur, mais ne débloquaient souvent pas complètement les capacités des modèles frontier. Les SDKs des fournisseurs eux-mêmes étaient plus proches du modèle, mais ne fournissaient pas toujours la transparence nécessaire sur la boucle de contrôle.
Et les APIs d'agents gérés simplifiaient le déploiement, mais limitaient rigidement où exactement l'agent fonctionne et comment il obtient l'accès aux données d'entreprise. OpenAI essaie de supprimer ce compromis par un harness natif du modèle — une couche de contrôle mieux alignée avec la façon dont les modèles fonctionnent réellement dans les tâches multi-étapes longues. Le SDK mis à jour inclut la mémoire configurable, l'orchestration consciente du sandbox, les outils du système de fichiers dans l'esprit de Codex, le support MCP, AGENTS.
md, shell et apply patch. Un cas pratique existe déjà chez Oscar Health. L'entreprise a testé la nouvelle infrastructure sur un flux de travail clinique où elle doit analyser de longs dossiers médicaux, extraire les métadonnées correctes et, plus important encore, identifier correctement les limites des épisodes de traitement individuels dans des documents complexes.
Selon l'équipe d'Oscar, les approches précédentes ne fournissaient pas suffisamment de fiabilité pour la production. Le nouveau Agents SDK a rendu ce scénario viable : le système analyse plus rapidement l'historique du patient et le personnel obtient une image plus claire d'une visite spécifique. Pour l'intégration à l'environnement d'entreprise, OpenAI a également ajouté l'abstraction Manifest.
Elle décrit l'espace de travail de l'agent : quels fichiers locaux peuvent être montés, où écrire les résultats et à partir de quels systèmes de stockage extraire les données. AWS S3, Azure Blob Storage, Google Cloud Storage et Cloudflare R2 sont supportés. Le principal accent de la mise à jour est la sécurité.
OpenAI suppose que tout agent qui lit du contenu externe ou exécute du code généré finira par rencontrer des prompt injections et des tentatives d'exfiltration de données. Par conséquent, l'entreprise sépare le harness de contrôle et la couche de calcul. Les identifiants et la boucle de contrôle principale restent en dehors de l'environnement où le code créé par le modèle s'exécute.
Cela réduit la chance qu'une instruction malveillante dans un document ou une demande puisse atteindre les clés, les APIs internes ou les systèmes voisins. Le problème de fiabilité dans les exécutions longues est également résolu séparément : si un conteneur s'écrase à la dix-neuvième étape sur vingt, l'exécution n'a pas besoin de recommencer à zéro. Le SDK sauvegarde l'état dans une couche externe, peut créer des snapshots et effectuer une rehydratation, puis continuer la tâche à partir du dernier point de contrôle dans un nouveau conteneur.
Cette architecture réduit simultanément les coûts cloud et simplifie la scalabilité : les exécutions peuvent être distribuées sur plusieurs sandboxes, les subagents peuvent être isolés et la charge de travail peut être parallélisée. Pour le marché, c'est un changement important : OpenAI promeut non pas un autre SDK pour les agents, mais une norme d'infrastructure plus complète pour le déploiement d'entreprise de systèmes agentic. Si l'approche s'enracine, l'entreprise renforcera sa position non seulement au niveau des modèles, mais aussi au niveau opérationnel, où les décisions sont prises sur la sécurité, l'audit et le coût de mise en œuvre.
Les nouvelles capacités sont déjà disponibles via l'API selon le modèle de tarification standard, d'abord pour Python, et le support de TypeScript est annoncé pour plus tard. L'étape logique suivante ressemble à code mode, subagents et une intégration plus étroite avec les outils internes des entreprises — tout ce qui est nécessaire pour transformer un agent d'une expérience en un flux de travail géré.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.