Кровь и пот ИИ: миллионы скрытых работников за каждым запросом к ChatGPT
За каждым ответом ChatGPT стоит невидимая армия — сотни тысяч аннотаторов из Кении, Пакистана, Венесуэлы. Они размечают данные, убирают токсичный контент и…
AI-обработка оригинала Habr AI; редакция Hamidun News
За каждым ответом ChatGPT, Gemini или Claude стоит невидимая армия людей — сотни тысяч аннотаторов и модераторов из развивающихся стран, без которых современный ИИ просто не работал бы. Их труд тщательно скрывается.
Кто стоит за ИИ Большие языковые модели не учатся сами по себе.
Им нужны люди — чтобы размечать данные, оценивать качество ответов, убирать токсичный контент и учить модель отличать хороший ответ от плохого. Без этого ручного труда RLHF — обучение с подкреплением от обратной связи человека, ключевая техника, делающая модели полезными, — невозможен. Эту работу выполняют миллионы аутсорсеров через платформы вроде Scale AI, Remotasks, Appen и Clickworker.
Большинство — из Кении, Пакистана, Индии, Венесуэлы, Филиппин и других стран, где можно нанять людей за считанные доллары в час. Разметка данных — определить объекты на изображении, категоризировать текст, проставить метки RLHF-оценивание — сравнить два ответа модели и выбрать лучший, объяснив почему Модерация — просматривать потоки сгенерированного контента и удалять вредоносное Red-teaming — намеренно пытаться сломать модель, чтобы найти уязвимости безопасности * Транскрипция и перевод — готовить обучающие датасеты для мультиязычных моделей ## Сколько они зарабатывают Ставки варьируются от $1 до $5 в час — в странах с низким уровнем жизни это всё равно немного. Большинство работников не имеют никаких гарантий: ни трудового договора, ни социального пакета, ни защиты от внезапного прекращения контракта.
Сегодня есть задания — завтра нет. Scale AI, которую оценивают в $13,8 млрд, строит бизнес именно на этой рабочей силе. Генеральный директор Александр Ван открыто говорил о создании «самой большой армии аннотаторов в мире», однако условия труда этой армии принципиально не фигурируют в корпоративных пресс-релизах.
Журналисты Time в 2023 году выяснили, что работники в Кении, нанятые через подрядчика Sama для модерации контента OpenAI, получали около $2 в час — и часами просматривали описания насилия, что приводило к психологическим травмам.
«Мы — секрет, который компании предпочитают не раскрывать», — говорит один из аннотаторов из
Найроби, одновременно работающий на три разные платформы.
Почему это скрывают AI-компании продают нарратив об автономных системах, которые учатся сами.
Признание колоссального человеческого труда за каждой моделью разрушает этот образ и ставит неудобные вопросы об ответственности. Юридически схема устроена так, что прямой связи между OpenAI и конкретным аннотатором из Лагоса не существует — есть многоуровневая цепочка подрядчиков. Это позволяет не включать работников в официальную статистику занятости и не брать на себя обязательства по соблюдению трудовых стандартов. Исследователи из Oxford Internet Institute назвали это явление ghost work — работа-призрак. Она абсолютно необходима для функционирования современных AI-систем, невидима конечному пользователю и намеренно вынесена за рамки корпоративной ответственности.
Что это значит ИИ-бум создал новый класс цифрового прекариата по всему миру.
Пока инвесторы вкладывают миллиарды в автономные системы, сотни тысяч людей на $2–3 в час ежедневно делают эти системы возможными. Без прозрачности в цепочках поставок данных технологический сектор рискует воспроизвести в цифровой экономике те же проблемы, которые давно критикуют в физическом производстве — с той разницей, что фабрики видно, а датацентры нет.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.