Agentes

Sandbox

Un sandbox es un entorno de ejecución aislado que restringe el acceso de un agente de IA a sistemas reales, redes o datos, permitiéndole ejecutar código no confiable o potencialmente dañino sin afectar el entorno anfitrión.

Un sandbox es un entorno de computación controlado e aislado utilizado para ejecutar código de forma segura, ejecutar agentes de IA o probar entradas no confiables sin exponer el sistema más amplio al riesgo. En contextos de IA, los sandboxes previenen que agentes autónomos realicen cambios no intencionales a archivos reales, bases de datos, redes o servicios externos.

Los sandboxes se implementan a través de contenedores a nivel del sistema operativo (como Docker), máquinas virtuales o restricciones a nivel de lenguaje como aislamiento de subprocesos. Un agente de IA que opera en un sandbox puede tener su acceso al sistema de archivos restringido a un directorio temporal, sus llamadas de red bloqueadas o proxied, y sus permisos de proceso limitados por el SO anfitrión. Algunos sandboxes también interceptan y registran cada llamada al sistema para revisión posterior y auditoría.

La necesidad de sandboxing crece con sistemas de IA agentes capaces de ejecutar código, navegar por la web o gestionar archivos autónomamente. Sin aislamiento, un agente desalineado o manipulado podría eliminar datos críticos, exfiltrar información sensible o disparar acciones del mundo real irreversibles. Los sandboxes son por lo tanto una capa de seguridad fundamental en pipelines de IA de múltiples pasos y asistentes de codificación autónomos.

Para 2026, marcos de agentes de IA principales — incluyendo Claude Code de Anthropic, el entorno Codex de OpenAI y Project Astra de Google — implementan sandboxing por defecto para la ejecución de código. Productos especializados como E2B y Modal han surgido para proporcionar sandboxes seguros de baja latencia como servicio administrado para desarrolladores de IA, y los proveedores de nube ofrecen tiempos de ejecución de sandbox efímeros específicamente diseñados para cargas de trabajo agentes.

Ejemplo

Cuando Claude Code genera un script de Python para reorganizar los archivos del proyecto de un usuario, ejecuta ese script dentro de un contenedor sandboxed para que incluso si el script contiene un bug destructivo, no pueda afectar archivos fuera del directorio de trabajo designado.

Términos relacionados

Últimas noticias sobre el tema

← Glosario