Sandbox
Un sandbox es un entorno de ejecución aislado que restringe el acceso de un agente de IA a sistemas reales, redes o datos, permitiéndole ejecutar código no confiable o potencialmente dañino sin afectar el entorno anfitrión.
Un sandbox es un entorno de computación controlado e aislado utilizado para ejecutar código de forma segura, ejecutar agentes de IA o probar entradas no confiables sin exponer el sistema más amplio al riesgo. En contextos de IA, los sandboxes previenen que agentes autónomos realicen cambios no intencionales a archivos reales, bases de datos, redes o servicios externos.
Los sandboxes se implementan a través de contenedores a nivel del sistema operativo (como Docker), máquinas virtuales o restricciones a nivel de lenguaje como aislamiento de subprocesos. Un agente de IA que opera en un sandbox puede tener su acceso al sistema de archivos restringido a un directorio temporal, sus llamadas de red bloqueadas o proxied, y sus permisos de proceso limitados por el SO anfitrión. Algunos sandboxes también interceptan y registran cada llamada al sistema para revisión posterior y auditoría.
La necesidad de sandboxing crece con sistemas de IA agentes capaces de ejecutar código, navegar por la web o gestionar archivos autónomamente. Sin aislamiento, un agente desalineado o manipulado podría eliminar datos críticos, exfiltrar información sensible o disparar acciones del mundo real irreversibles. Los sandboxes son por lo tanto una capa de seguridad fundamental en pipelines de IA de múltiples pasos y asistentes de codificación autónomos.
Para 2026, marcos de agentes de IA principales — incluyendo Claude Code de Anthropic, el entorno Codex de OpenAI y Project Astra de Google — implementan sandboxing por defecto para la ejecución de código. Productos especializados como E2B y Modal han surgido para proporcionar sandboxes seguros de baja latencia como servicio administrado para desarrolladores de IA, y los proveedores de nube ofrecen tiempos de ejecución de sandbox efímeros específicamente diseñados para cargas de trabajo agentes.