OpenAI revelou os princípios de segurança do Sora 2: de deepfakes à rotulagem de conteúdo
OpenAI revelou como a segurança foi incorporada ao Sora 2 desde o início do desenvolvimento. O modelo de vídeo de nova geração e a plataforma social para…
Processado por IA de OpenAI Blog; editado por Hamidun News
A OpenAI publicou uma descrição detalhada da abordagem de segurança que fundamenta o Sora 2 — a nova versão do modelo de geração de vídeo — e do aplicativo correspondente de criação de conteúdo. A empresa enfatiza: a segurança não foi adicionada sobre um produto pronto — foi construída na arquitetura desde o início do desenvolvimento. O Sora 2 representa uma nova geração do modelo de vídeo da OpenAI, capaz de gerar vídeos realistas a partir de comandos textuais e visuais com qualidade substancialmente superior.
Simultaneamente, a OpenAI lançou o Sora como uma plataforma social independente orientada para usuários criativos: artistas, diretores, blogueiros e criadores de conteúdo. É precisamente a combinação de um modelo poderoso e uma plataforma pública aberta que, na visão da empresa, cria desafios de segurança fundamentalmente novos — aqueles que a indústria não havia enfrentado nessa escala anteriormente.
A proteção é organizada em múltiplos níveis. O primeiro é o controle no nível do próprio modelo. O Sora 2 é treinado para rejeitar solicitações que violam a política de uso aceitável: criação de deepfakes de pessoas reais sem seu consentimento, conteúdo sexualizado envolvendo menores, materiais que promovem violência ou disseminam desinformação. Esta camada de proteção é integrada diretamente aos pesos do modelo e é ativada antes mesmo do conteúdo começar a ser gerado. O segundo nível compreende medidas do lado da plataforma. O aplicativo Sora inclui verificação de idade, restrições regionais em certos tipos de conteúdo, sistemas de denúncia e ferramentas de moderação que permitem aos usuários relatar violações.
Atenção especial merece o trabalho com atribuição de conteúdo. Todos os vídeos criados através do Sora são marcados usando o padrão C2PA (Coalition for Content Provenance and Authenticity) — um conjunto de metadados técnicos que permite identificar o material como gerado por IA. Isso significa que mesmo após baixar e republicar um vídeo, sua origem pode ser estabelecida tecnicamente. A iniciativa visa combater a desinformação: redações, plataformas e usuários comuns poderão ver o que foi criado por IA em vez de capturado por câmera.
Outro elemento importante é o teste externo. Antes do lançamento público, a OpenAI conduziu um red teaming em larga escala: pesquisadores independentes de segurança, cineastas e organizações de direitos humanos testaram o modelo sob estresse, tentando identificar vulnerabilidades e maneiras de contornar restrições. Suas descobertas influenciaram diretamente a configuração final do sistema de segurança.
A empresa reconhece abertamente: nenhum mecanismo de proteção oferece garantias absolutas. A aposta é colocada em proteção em camadas — uma combinação de limitações de modelo, regras de plataforma, atribuição técnica e ferramentas de moderação. Em vez de buscar um filtro perfeito único, a OpenAI está construindo um sistema de barreiras mutuamente complementares, cada uma das quais complica o abuso.
Lançar modelos de vídeo poderosos em acesso público é sempre um compromisso entre potencial criativo e riscos. Quanto mais realista o conteúdo sintetizado, maiores as apostas para a sociedade. O teste real da abordagem da OpenAI virá não no momento do lançamento, mas conforme o Sora 2 começar a ser usado por milhões de pessoas em contextos mais variados — incluindo imprevisíveis.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.