ChatGPT Cites Grokipedia: OpenAI Found a New Source of Truth
Сэм Альтман и Илон Маск снова в одной лодке, пусть и не по своей воле. В ответах ChatGPT стали замечать фрагменты из Grokipedia — консервативной ИИ-энциклопедии

Мир искусственного интеллекта тесен, но мы не ожидали, что он станет настолько тесным так быстро. Пользователи ChatGPT обнаружили нечто странное: нейросеть начала подтягивать данные из Grokipedia. Если вы пропустили этот запуск, Grokipedia — это амбициозный проект xAI Илона Маска, который позиционирует себя как база знаний без цензуры и левой повестки. Ирония ситуации зашкаливает: компания Сэма Альтмана, которую Маск регулярно обвиняет в излишней прогрессивности и закрытости, теперь опирается на его же детище для формирования своих ответов.
Чтобы понять, как мы до этого дошли, нужно вспомнить историю конфликта. Маск стоял у истоков OpenAI, потом ушел, громко хлопнув дверью, и запустил свой xAI с анти-повесткой. Grokipedia стала его ответом на Википедию, которую Илон считает слишком предвзятой. Это огромный массив данных, генерируемый и модерируемый алгоритмами xAI. И вот теперь эти данные всплывают в ChatGPT. Почему это происходит именно сейчас? Ответ прост и одновременно тревожен: OpenAI отчаянно нужны свежие данные, и компания не слишком разборчива в методах их получения.
Веб-краулеры OpenAI прочесывают интернет круглосуточно. Когда xAI выкатила Grokipedia в открытый доступ, она автоматически стала частью общественного достояния для поисковых ботов. Похоже, инженеры Альтмана не стали ставить фильтр на домены Маска, или же алгоритмы ранжирования посчитали контент Grokipedia достаточно релевантным. В итоге получился забавный коктейль. ChatGPT, который обычно старается обходить острые углы, внезапно выдает факты или интерпретации, характерные для Grok. Это не просто технический курьез, это признак надвигающегося кризиса данных во всей индустрии.
Мы вплотную подошли к моменту, когда качественный человеческий контент в сети попросту заканчивается. Разработчики больших языковых моделей начинают поедать контент, созданный другими моделями. В профессиональной среде это называют деградацией модели или цифровым инцестом. Если ChatGPT будет учиться на данных Grokipedia, а Grok продолжит обучаться на ответах ChatGPT, мы рискуем получить замкнутую эхо-камеру. В такой системе ошибки и предвзятости будут множиться в геометрической прогрессии, постепенно отдаляя ИИ от реальности.
Для Илона Маска эта ситуация выглядит как двойственная победа. С одной стороны, его база знаний признана достаточно весомой, чтобы её цитировал лидер рынка. С другой — OpenAI бесплатно пользуется ресурсом, на который xAI потратила миллионы долларов и огромные вычислительные мощности. Это напоминает ситуацию с Reddit и Twitter, которые закрыли свои API, чтобы ИИ-гиганты не воровали их контент для обучения. Вполне вероятно, что следующим шагом Маска станет закрытие Grokipedia от ботов OpenAI или очередной громкий судебный иск о нарушении интеллектуальной собственности.
Проблема заимствования данных между нейросетями ставит перед нами важный этический вопрос. Если ИИ начинает цитировать другой ИИ без прямой ссылки на первоисточник, как мы сможем проверять достоверность информации? Пока что мы наблюдаем за тем, как два главных конкурента в индустрии невольно сливаются в едином информационном поле. Это может привести либо к созданию универсального суперинтеллекта, либо к полному коллапсу смыслов, где одна нейросеть просто пересказывает галлюцинации другой.
Главное: Станет ли этот случай поводом для новой войны за авторское право между Маском и Альтманом, или мы официально вступили в эпоху, где ИИ обучают друг друга до полной потери связи с человеческим первоисточником?