OpenAI reveló los principios de seguridad de Sora 2: de los deepfakes al etiquetado de contenido
OpenAI reveló cómo la seguridad se integró en Sora 2 desde el inicio del desarrollo. El modelo de video de nueva generación y la plataforma social para la…
Procesado por IA desde OpenAI Blog; editado por Hamidun News
OpenAI publicó una descripción detallada del enfoque de seguridad que subyace en Sora 2 — la nueva versión del modelo de generación de vídeo — y la correspondiente aplicación de creación de contenido. La empresa enfatiza: la seguridad no se añadió sobre un producto acabado — fue integrada en la arquitectura desde el mismo inicio del desarrollo. Sora 2 representa una nueva generación del modelo de vídeo de OpenAI, capaz de generar vídeos realistas a partir de indicaciones textuales y visuales con una calidad sustancialmente superior.
Simultáneamente, OpenAI lanzó Sora como una plataforma social independiente orientada hacia usuarios creativos: artistas, directores, blogueros y creadores de contenido. Es precisamente la combinación de un modelo potente y una plataforma pública abierta la que, en opinión de la empresa, crea desafíos de seguridad fundamentalmente nuevos — desafíos que la industria no había enfrentado anteriormente en esta escala.
La protección se organiza en múltiples niveles. El primero es el control a nivel del modelo mismo. Sora 2 está entrenado para rechazar solicitudes que violan la política de uso aceptable: creación de deepfakes de personas reales sin su consentimiento, contenido sexualizado que implica a menores, materiales que promueven violencia o difunden desinformación. Esta capa de protección está integrada directamente en los pesos del modelo y se activa antes de que se genere contenido alguno. El segundo nivel comprende medidas del lado de la plataforma. La aplicación Sora incluye verificación de edad, restricciones regionales en ciertos tipos de contenido, sistemas de denuncias y herramientas de moderación que permiten a los usuarios reportar violaciones.
Merece atención especial el trabajo con la atribución de contenido. Todos los vídeos creados a través de Sora se etiquetan utilizando el estándar C2PA (Coalition for Content Provenance and Authenticity) — un conjunto de metadatos técnicos que permite identificar el material como generado por IA. Esto significa que incluso después de descargar y republicar un vídeo, su origen puede ser establecido técnicamente. La iniciativa está dirigida a combatir la desinformación: redacciones, plataformas y usuarios comunes podrán ver qué fue creado por IA en lugar de capturado por cámara.
Otro elemento importante es las pruebas externas. Antes del lanzamiento público, OpenAI llevó a cabo red teaming a gran escala: investigadores independientes de seguridad, cineastas y organizaciones de derechos humanos sometieron el modelo a pruebas de estrés, intentando identificar vulnerabilidades y formas de eludir restricciones. Sus hallazgos influyeron directamente en la configuración final del sistema de seguridad.
La empresa reconoce abiertamente: ningún mecanismo de protección proporciona garantías absolutas. La apuesta se coloca en la protección en capas — una combinación de limitaciones del modelo, reglas de la plataforma, atribución técnica y herramientas de moderación. En lugar de buscar un filtro único perfecto, OpenAI está construyendo un sistema de barreras mutuamente complementarias, cada una de las cuales complica el abuso.
Lanzar modelos de vídeo poderosos al acceso público siempre es un compromiso entre el potencial creativo y los riesgos. Cuanto más realista es el contenido sintetizado, mayores son las apuestas para la sociedad. La prueba real del enfoque de OpenAI llegará no en el momento del lanzamiento, sino conforme Sora 2 comience a ser utilizado por millones de personas en contextos los más variados — incluyendo los impredecibles.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.