Почему идея world model Янна ЛеКуна не решает главный кризис развития LLM
После ухода Янна ЛеКуна из Meta его world model снова обсуждают как альтернативу тупиковой гонке LLM. Идея в том, чтобы учить ИИ не только на тексте, но и на да

После ухода Янна ЛеКуна из Meta его концепцию world model снова обсуждают как возможный выход из тупика больших языковых моделей. Но главный тезис критиков звучит жёстко: даже если ИИ научится лучше описывать физический мир, это ещё не даст ему человеческий смысл и понимание.
Почему идея вернулась Интерес к подходу ЛеКуна вырос на фоне усталости рынка от привычной гонки LLM.
Чем больше модели, тем дороже обучение, тем заметнее дефицит качественных данных и тем чаще возникает вопрос, можно ли вообще дойти до сильного ИИ, если система по сути всё ещё угадывает следующий токен. На этом фоне world model звучит как попытка сменить саму траекторию развития: вместо бесконечного масштабирования текста учить модель структуре окружающей реальности, причинности и последствиям действий. В основе идеи лежит довольно простая интуиция. Человек понимает мир не потому, что прочитал все возможные тексты, а потому что живёт в среде, где предметы падают, сталкиваются, ломаются, перемещаются и подчиняются устойчивым правилам. Если нейросеть сможет строить внутреннюю модель такой среды, она якобы научится отбрасывать шум, видеть главное и действовать не как автодополнение, а как агент с более устойчивым представлением о реальности.
В чём ставка
Сильная сторона этого подхода в том, что он действительно отвечает на одну из главных проблем LLM: зависимость от текстовых корпусов. Текст в интернете конечен, его качество неравномерно, а синтетические данные быстро начинают загрязнять обучение. Данные физического мира выглядят как запасной источник масштаба: видео, сенсоры, роботы, симуляции, взаимодействие с объектами.
В этом смысле ЛеКун предлагает не косметический апгрейд, а новую обучающую среду. меньше зависимость от исчерпаемых текстовых датасетов больше опоры на причинность, а не только на статистические совпадения возможность учить модель действиям, а не только ответам более естественный путь к робототехнике и агентным системам Именно поэтому идея world model кажется привлекательной инвесторам и инженерам. Она обещает, что следующий скачок в ИИ придёт не из ещё одного увеличения числа параметров, а из более тесной связи модели с реальным миром.
Для индустрии, которая уже упёрлась в стоимость обучения и в уменьшающуюся отдачу от масштаба, такой разворот выглядит почти неизбежным.
Где слабое место
Критика начинается там, где заканчивается красивая метафора и начинается содержание знаний. Физический мир очень богат на события, но его базовые закономерности удивительно компактны. Огромное число ситуаций сводится к небольшому набору правил, и именно поэтому наука описывает их формулами, а не бесконечными каталогами частных случаев.
Если обучить модель на падениях, столкновениях и перемещениях объектов, она, возможно, станет лучше предсказывать динамику среды, но из этого не следует, что она поймёт право, экономику, юмор, мотивацию людей или исторический контекст. Здесь и возникает главный контраргумент: человеческие знания шире физики. Мы живём не только среди вещей, но и среди смыслов, норм, символов, институтов и коллективного опыта.
Даже идеальная модель траектории мяча не объяснит, почему одни законы работают, а другие вызывают сопротивление общества, почему одна и та же фраза звучит как шутка в одном контексте и как оскорбление в другом, или почему люди принимают решения вопреки рациональной выгоде. Мир объектов можно смоделировать, но мир значений устроен намного сложнее. Отсюда вывод автора статьи: world model может быть полезным дополнением к ИИ, но вряд ли станет спасением всей отрасли.
Она способна закрыть часть дефицита данных и дать моделям более устойчивую связь с причинностью. Однако сама по себе физика мира беднее культурного и когнитивного слоя, который делает человеческое мышление тем, чем оно является. Потратить миллиарды на то, чтобы ещё лучше открыть давно известные законы падения тел, — слишком слабое объяснение будущего прорыва.
Что это значит Для рынка это важный холодный душ.
Следующий этап развития ИИ, скорее всего, потребует не одной серебряной пули, а комбинации подходов: языковых моделей, данных из реального мира, агентного поведения и более глубоких представлений о человеческом контексте. Идея ЛеКуна полезна как часть этой конструкции, но не как её готовая замена.