Нейросеть как машина времени: зачем LLM учат думать по-старинному

Q: Источник материала?

Оригинальная публикация на Habr AI. Hamidun News обрабатывает и адаптирует материалы с помощью AI.

Q: Когда опубликовано?

2026-03-01. Время чтения: 3 мин.

Исследователи нашли парадоксальный способ использования LLM: вместо расширения обучающих данных они их ограничивают, создавая модели, которые «думают» как люди

ЖХ

Редакция Hamidun News

AI‑мониторинг · Habr AI

2026-03-01· 2 мин

Нейросеть как машина времени: зачем LLM учат думать по-старинному — Источник: Habr AI. Коллаж: Hamidun News.

Языковые модели принято оценивать по объёму знаний: чем больше данных поглотила нейросеть, тем она умнее. Но группа исследователей и энтузиастов перевернула эту логику с ног на голову. Они намеренно урезают обучающие датасеты, ограничивая их текстами конкретной исторической эпохи, — и получают нечто совершенно неожиданное: искусственный интеллект, который рассуждает так, словно живёт в XVII или начале XX века.

Идея на первый взгляд кажется экзотической причудой. Зачем кому-то нужна модель, которая не знает о существовании антибиотиков, теории относительности или интернета? Однако за этим стоит серьёзная научная мотивация. Современные LLM обучены на корпусах текстов, охватывающих всю историю письменности вплоть до наших дней. Они неизбежно смотрят на прошлое через призму настоящего — с его терминологией, ценностями и накопленным знанием. Модель, обученная только на текстах до 1912 года, лишена этой ретроспективной оптики. Она не просто воспроизводит слова эпохи — она воспроизводит её способ мышления, её слепые пятна, её уверенность в вещах, которые мы давно считаем заблуждениями.

Технически подход выглядит следующим образом. Берётся архитектура стандартной языковой модели — как правило, относительно компактной, поскольку объём исторических текстов ограничен. Обучающий корпус формируется исключительно из источников, датированных определённым периодом: книги, газеты, письма, научные трактаты, юридические документы. Критически важно исключить любые тексты, написанные позднее выбранной даты отсечения. В результате модель усваивает не только лексику и грамматику эпохи, но и её эпистемологические рамки — то есть границы того, что люди того времени считали возможным, истинным и допустимым.

Применение таких «темпоральных» моделей оказывается куда шире, чем можно предположить. В области гносеологии — науки о познании — они позволяют исследовать, как менялись сами механизмы формирования знания. Можно задать модели образца 1650 года вопрос о природе болезней и получить ответ, основанный на гуморальной теории, — не как стилизацию, а как искреннее убеждение системы, для которой микробная теория попросту не существует. Это даёт учёным уникальный инструмент для моделирования исторических парадигм мышления.

В бихевиоральных науках такие модели помогают изучать, как культурный и информационный контекст формирует поведение и решения. Если поместить LLM в рамки знаний определённой эпохи, можно моделировать реакции на события, экономические решения, социальные установки — и сравнивать их с реальными историческими данными. По сути, это форма вычислительной исторической психологии, которая ещё несколько лет назад была немыслима.

Образовательный потенциал тоже впечатляет. Представьте интерактивный диалог с «учёным» эпохи Просвещения, который не просто цитирует тексты XVIII века, а последовательно рассуждает в рамках тогдашней картины мира. Студент может задавать вопросы, спорить, сталкиваться с логикой, которая была безупречной для своего времени, но выглядит абсурдной сегодня. Это мощнейший способ показать, что знание — не абсолютная величина, а исторически обусловленный процесс.

Несколько открытых инициатив уже работают в этом направлении. Проекты, о которых рассказывают специалисты Beeline Cloud, развивают как сами модели, так и методологию подготовки исторических корпусов. Ключевая сложность здесь — качество данных. Оцифрованные тексты прошлых веков часто содержат ошибки распознавания, а отбор источников требует серьёзной экспертизы историков, чтобы корпус адекватно представлял мышление эпохи, а не только её литературную элиту.

Есть и фундаментальный вопрос, который поднимает этот подход. Если модель, обученная на текстах прошлого, воспроизводит заблуждения и предрассудки своего времени, то что это говорит о современных LLM? Они точно так же ограничены рамками нашей эпохи — просто мы пока не знаем, какие из наших «очевидных истин» будущие поколения сочтут наивными. Темпоральные модели превращаются в зеркало, которое напоминает: любой интеллект, искусственный или нет, — это продукт своего времени. И осознание этого факта, возможно, ценнее любого технологического прорыва.

ЖХ

Hamidun News

AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Telegram-канал RSS hamidun.com