Безопасность

Приватность данных

Приватность данных в контексте ИИ — совокупность технических и правовых мер, защищающих персональные сведения при сборе обучающих данных, дообучении и эксплуатации моделей. Нарушение приватности грозит утечкой личной информации, юридической ответственностью и потерей доверия пользователей.

Приватность данных применительно к ИИ охватывает весь жизненный цикл информации: от первоначального сбора данных для предобучения до хранения пользовательских запросов в продакшне. Центральный вопрос — в какой мере личные данные, попавшие в обучающий корпус или переданные модели через интерфейс, могут быть впоследствии извлечены, раскрыты третьим лицам или использованы без согласия их владельца.

Технические методы защиты включают: дифференциальную приватность (добавление калиброванного шума к градиентам обучения, не позволяющего модели запоминать отдельные примеры), федеративное обучение (адаптация модели на устройстве пользователя без передачи сырых данных на внешние серверы) и «машинное забывание» (machine unlearning) — процедуры удаления конкретного субъекта из весов уже обученной модели. Ни один метод не даёт абсолютной гарантии: исследования показали, что крупные языковые модели способны дословно воспроизводить фрагменты обучающего текста, включая номера телефонов и медицинские записи.

Регуляторный контекст определяется GDPR в Европе, требующим правового основания для обработки персональных данных и права субъекта на удаление. С 2024 года Европейский закон об ИИ добавил обязательные требования к прозрачности для высокорисковых систем. В ряде юрисдикций поставщики ИИ-сервисов обязаны публиковать политики хранения данных и предоставлять возможность отказа от использования запросов в дообучении.

К 2026 году OpenAI, Anthropic и Google предлагают корпоративные тарифы с явным запретом на использование данных клиентов в обучении и сквозным шифрованием запросов. Регуляторные расследования в ЕС проверяют, соответствовали ли практики сбора данных для предобучения крупных моделей нормам о согласии субъектов данных.

Пример

Медицинская компания, внедряющая ИИ-ассистента для врачей, использует федеративное обучение: модель адаптируется к локальным записям пациентов прямо на серверах больницы, и ни одна история болезни не покидает защищённый периметр клиники, что соответствует требованиям GDPR и HIPAA.

Связанные термины

Федеративное обучение Обучающие данные Локальный ИИ (on-device)

← Глоссарий