MIT Technology Review→ оригинал

Глубокие фейки и утечки данных: как AI нарушает приватность

Исследование MIT Technology Review выявило две критические угрозы приватности в эпоху AI. Первая: порно-дипфейки, в которых без согласия используют чужие тела и

Глубокие фейки и утечки данных: как AI нарушает приватность
Источник: MIT Technology Review. Коллаж: Hamidun News.
◐ Слушать статью

Исследование MIT Technology Review раскрывает две серьёзные угрозы приватности, которые порождает современный AI: женщины обнаруживают свои тела в поддельных порно-видео, созданных с помощью дипфейка, а большие языковые модели непреднамеренно раскрывают приватные номера телефонов и другие личные данные.

Deepfake порно как глобальная проблема

Когда Jennifer получила работу в 2023 году, она провела свой профессиональный снимок через facial recognition программу — стандартная процедура для новых сотрудников. Несколько дней спустя случился шок: женщина обнаружила видео, в котором её лицо и тело были использованы для создания порно-контента без всякого согласия. История Jennifer — далеко не исключение.

По данным исследований, более 99% всех deepfake видео — это именно порно, и подавляющее большинство жертв — женщины и девочки. Инструменты для создания таких видео становятся всё более доступными. Сегодня бесплатные приложения и простые скрипты позволяют любому человеку без специальных навыков создавать убедительные видео всего за несколько часов.

Проблема масштабируется: платформы размещения контента борются с волной deepfake порно, но удалить материал бывает невозможно, если он уже распространился. Для жертв это означает перманентный позор, психологическую травму, и часто — невозможность доказать в суде, что это был именно они. Кроме того, каждое переиздание видео создаёт новую травму.

Когда AI раскрывает личное

Параллельно исследование обнаружило вторую угрозу: большие языковые модели непреднамеренно воспроизводят приватные данные. Когда люди вводят свои номера телефонов, email адреса и другую личную информацию в AI-ассистенты, эти данные могут быть сохранены в обучающих данных и позже воспроизведены в ответах другим пользователям. Во время обучения модели поглощают огромные объёмы текста из интернета — включая приватные сообщения, базы данных, утечки из компаний. Система потом может воспроизводить эту информацию, если на неё случайно натолкнётся подходящий запрос. Пользователи часто не знают, что их личная информация скопирована в саму модель и может быть раскрыта.

  • Номера телефонов воспроизводятся в значительном проценте тестов Email адреса раскрываются ещё чаще Социальные номера, адреса и другие данные тоже рискуют быть раскрыты * Пользователи обычно не информированы об этом риске при использовании сервиса ## Правовой вакуум Ни deepfake порно, ни утечка данных через AI не имеют адекватной правовой защиты в большинстве юрисдикций. Европа движется быстрее, благодаря GDPR и новому AI Act, но в США, России и многих других странах жертвы обычно остаются без реального способа защитить свои права. Компании, создающие AI модели, редко несут достаточную ответственность. Нет единого стандарта, как очищать обучающие данные от приватной информации, и нет строгих штрафов за утечки. Некоторые компании даже не раскрывают, произошла ли утечка, скрывая проблему от общественности.

Что это значит

Две эти проблемы показывают более широкую картину: AI развивается в правовом вакууме, с минимальной ответственностью разработчиков перед жертвами. Срочно нужны решения на трёх уровнях: технические решения для фильтрации обучающих данных и защиты от дипфейков, юридические — уголовная ответственность за создание и распространение порно-дипфейков, и образовательные — люди должны знать об этих рисках. Без комплексного подхода волна нарушений приватности будет только расти. Разработчики AI систем должны взять на себя ответственность за то, какие данные они собирают и как их используют. А регуляторы должны наконец начать действовать.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Что вы думаете?
Загружаем комментарии…