OpenAI agrega ejecución en sandbox al Agents SDK para control y ejecución segura de agentes de IA
OpenAI actualizó el Agents SDK y agregó un sandbox nativo para ejecución aislada de tareas de agentes. Los equipos empresariales pueden ejecutar workflows…
Procesado por IA desde AI News; editado por Hamidun News
OpenAI está intentando cerrar una de las grietas más dolorosas en los agentes de IA corporativos: cómo dar acceso a un modelo a archivos, código y entorno de trabajo sin convertirlo en un riesgo incontrolado para la empresa. Una nueva actualización del Agents SDK añade ejecución nativa en sandbox — una capa de ejecución aislada donde un agente puede leer y escribir archivos, ejecutar comandos y trabajar con dependencias sin obtener acceso directo a la infraestructura sensible. Para equipos que ya han superado las demostraciones e intentan ejecutar flujos de trabajo agentic en producción, esto no es una actualización cosmética, sino un intento de resolver tres problemas simultáneamente: gobernanza, confiabilidad y coste de ejecuciones largas.
Hasta ahora, los desarrolladores enfrentaban una opción desagradable. Los marcos agnósticos de modelo ofrecían libertad y permitían no estar vinculado a un único proveedor, pero a menudo no desbloqueaban completamente las capacidades de los modelos frontier. Los SDKs de los propios proveedores estaban más cerca del modelo, pero no siempre proporcionaban la transparencia necesaria sobre el bucle de control.
Y las APIs de agentes gestionadas simplificaban la implementación, pero limitaban rígidamente dónde exactamente funciona el agente y cómo obtiene acceso a los datos corporativos. OpenAI intenta eliminar este compromiso a través de un harness nativo del modelo — una capa de control mejor alineada con la forma en que los modelos realmente funcionan en tareas multietapa largas. El SDK actualizado incluye memoria configurable, orquestación consciente de sandbox, herramientas de sistema de archivos en el espíritu de Codex, soporte MCP, AGENTS.
md, shell y apply patch. Un caso práctico ya existe en Oscar Health. La empresa probó la nueva infraestructura en un flujo de trabajo clínico donde necesita analizar largos registros médicos, extraer metadatos correctos e, lo que es más importante, identificar correctamente los límites de episodios individuales de tratamiento dentro de documentos complejos.
Según el equipo de Oscar, los enfoques anteriores no proporcionaban suficiente confiabilidad para producción. El nuevo Agents SDK hizo viable tal escenario: el sistema analiza el historial del paciente más rápidamente y el personal obtiene una visión más clara de una visita específica. Para integración con el entorno corporativo, OpenAI también añadió la abstracción Manifest.
Describe el espacio de trabajo del agente: qué archivos locales se pueden montar, dónde escribir resultados y desde qué sistemas de almacenamiento extraer datos. Se admiten AWS S3, Azure Blob Storage, Google Cloud Storage y Cloudflare R2. El enfoque principal de la actualización es la seguridad.
OpenAI asume que cualquier agente que lea contenido externo o ejecute código generado eventualmente encontrará prompt injection e intentos de exfiltración de datos. Por lo tanto, la empresa separa el harness de control y la capa de computación. Las credenciales y el bucle de control principal permanecen fuera del entorno donde se ejecuta el código creado por el modelo.
Esto reduce la probabilidad de que una instrucción maliciosa dentro de un documento o solicitud pueda alcanzar claves, APIs internas o sistemas vecinos. El problema de confiabilidad en ejecuciones largas también se aborda por separado: si un contenedor falla en el decimonoveno paso de veinte, la ejecución no necesita comenzar desde cero. El SDK guarda el estado en una capa externa, puede crear snapshots y realizar rehydration, y luego continuar la tarea desde el último checkpoint en un nuevo contenedor.
Esta arquitectura simultáneamente reduce costes en la nube y simplifica el escalado: las ejecuciones se pueden distribuir entre múltiples sandboxes, los subagents se pueden aislar y la carga de trabajo se puede paralelizar. Para el mercado, este es un cambio importante: OpenAI está promoviendo no solo otro SDK para agentes, sino un estándar de infraestructura más completo para la implementación corporativa de sistemas agentic. Si el enfoque prospera, la empresa reforzará su posición no solo a nivel de modelo, sino también en la capa operativa, donde se toman decisiones sobre seguridad, auditoría y costes de implementación.
Las nuevas capacidades ya están disponibles a través de la API bajo el modelo de precios estándar, primero para Python, y se anuncia soporte para TypeScript posteriormente. El siguiente paso lógico parece ser code mode, subagents e integración más estrecha con herramientas internas de las empresas — todo lo que se necesita para convertir un agente de un experimento en un flujo de trabajo gestionado.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.