Подрядчики Meta притворялись детьми и тестировали ChatGPT и Gemini на опасные темы
Сотни подрядчиков Meta изображали детей в переписке с Gemini и ChatGPT — и намеренно провоцировали конкурирующие чат-боты на разговор о суициде, сексе и…
AI-обработка оригинала Wired; редакция Hamidun News
Сотни подрядчиков Meta притворялись подростками, чтобы спровоцировать Gemini, ChatGPT и другие чат-боты конкурентов на обсуждение суицида, секса и наркотиков. Расследование Wired раскрывает детали закрытого проекта, поднимающего острые вопросы об этике конкурентной разведки в эпоху AI.
Схема и масштаб В рамках внутреннего проекта
Meta сотни подрядчиков получали инструкции: изображать несовершеннолетних пользователей и вести диалоги с конкурирующими системами — Google Gemini, ChatGPT и рядом других чат-ботов. Задача — зафиксировать, насколько легко вывести эти системы на обсуждение опасных тем: суицида, сексуального насилия, наркотиков. Работа велась через специализированные инструменты на протяжении нескольких месяцев. Подрядчики не раскрывали принадлежность ни системе, ни её разработчикам — они выглядели как обычные пользователи, интересующиеся чувствительными темами. По данным Wired, схема охватывала сотни людей, генерировавших тысячи тестовых сессий ежедневно. Примечательно, что под прицел попадали исключительно конкуренты — собственные модели Meta (Llama, Meta AI) в тесты не входили.
В чём проблема
Компании регулярно практикуют red-teaming — метод, при котором специально обученные команды пытаются взломать или обмануть систему, чтобы найти уязвимости до того, как их найдут злоумышленники. Это признанный и одобренный регуляторами подход к повышению безопасности AI-продуктов. Но проект Meta принципиально отличается от стандартного red-teaming: *Объект — конкуренты, а не собственный продукт.
Meta не улучшала свою безопасность — она документировала чужие слабости. Метод — систематическая имитация детей.* Создание фиктивных профилей несовершеннолетних для манипуляции AI-системами выходит за рамки признанных этических стандартов.
* Непрозрачность. Ответственное тестирование предполагает хотя бы минимальные этические протоколы. Здесь ничего этого не было.
* Потенциальное двойное использование. Meta неоднократно публично критиковала конкурентов за недостаточную защиту детей. Если эта критика подкреплена данными, полученными скрытыми провокациями, — это манипуляция, а не реальная забота о безопасности.
Реакция рынка и регуляторов
Ни Google, ни OpenAI публично не прокомментировали конкретные инциденты из расследования Wired. Представители Meta на момент публикации также не подтвердили и не опровергли детали. Источники издания — нынешние и бывшие подрядчики, непосредственно работавшие над проектом.
«Тестировать безопасность — нормально и необходимо.
Систематически притворяться ребёнком, чтобы дискредитировать чужой продукт, — это совсем другое», — считают эксперты по AI-этике, опрошенные Wired. В Европе подобная деятельность потенциально подпадает под DSA (Digital Services Act), регулирующий работу платформ с несовершеннолетними и устанавливающий требования к прозрачности. Американские законодатели пока не имеют сопоставимых инструментов, хотя детская онлайн-безопасность не первый год обсуждается в Конгрессе — в частности, в рамках KOSA (Kids Online Safety Act). Существенный момент: сами чат-боты — Gemini и ChatGPT — действительно продемонстрировали уязвимости, реагируя на запросы «подростков» контентом о суициде и наркотиках. Проблема реальная, независимо от методов её выявления.
Что это значит
История с подрядчиками Meta — симптом системной проблемы: у индустрии нет общепринятых стандартов adversarial testing для AI-систем. Пока правила не зафиксированы законодательно, крупные игроки будут трактовать «безопасностное тестирование» каждый по-своему — включая методы, которые больше напоминают конкурентную разведку под прикрытием. Регуляторам это должно стать недвусмысленным сигналом к действию. *Meta признана экстремистской организацией и запрещена в РФ.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.
Главное из мира ИИ — раз в неделю
7 ключевых событий недели, отобранных вручную. Без шума, репостов и пресс-релизов.
Готово! Проверьте почту — мы отправили подтверждение.