IEEE Spectrum AI→ оригинал

GPT-4 помогает архивистам расшифровать рукописные документы в 50 раз быстрее

Исследование канадского университета показало: GPT-4 расшифровывает рукописные архивы быстрее и дешевле, чем специализированный Transkribus. На 50 раз дешевле и

GPT-4 помогает архивистам расшифровать рукописные документы в 50 раз быстрее
Источник: IEEE Spectrum AI. Коллаж: Hamidun News.
◐ Слушать статью

В 2023 году Марк Хамфрис, историк и координатор программы по применению generative AI в Wilfrid Laurier University (Ватерлу, Онтарио), столкнулся с масштабной проблемой. Он оцифровал 10 миллионов страниц канадских пенсионных записей времён Первой мировой войны, но без индекса и стандартизации эти архивы были практически неиспользуемы — поиск конкретного пенсионера означал перелистывать файлы вслепую. Записи вели сотни разных писарей, офицеров и администраторов, что исключало стандартное решение: обучить специализированную модель на одном почерке.

Хамфрис решил попробовать GPT-4. Результаты были грубыми, но лучше, чем у любого другого инструмента. Он с коллегами потратил два года на систематическое тестирование — анализировали письма, правовые документы и дневники XVIII–XIX веков из разных стран.

Исследование, опубликованное в май 2025 в журнале Historical Methods, показало поразительное: LLM обошли Transkribus — специализированный софт, используемый 150+ крупными архивами и университетами. Числа впечатляют. На одном и том же наборе документов, которые модели раньше не видели, Transkribus допускал ошибку чтения в 8%.

LLM Хамфриса остановились на 2%. При этом скорость выросла в 50 раз, а стоимость упала в 50 раз. Компания за Transkribus уже объявила, что интегрирует LLM в свой собственный продукт.

«Это было нашей мечтой», — рассказал Хамфрис в интервью.

Архивы из закрытой книги становятся открытой

Практические последствия уже видны в университетах по всей Северной Америке. Лианн Лэдди, историк Indigenous Histories и соавтор исследования, использует AI для поиска упоминаний о коренных женщинах Северной Америки в старых торговых журналах, крестильных и брачных записях, разбросанных по архивам от побережья до побережья. Проблема: эти записи писали мужчины (торговцы, священники, чиновники), и женские имена часто записывались только фонетически, по-разному — французы, англичане, шотландцы могли написать одно имя пятью способами.

Или женщина упоминалась просто как «жена кого-то». Чтобы собрать полную историю в старом темпе, нужны были десятилетия работы. Теперь это месяцы.

Университет Северной Каролины (Chapel Hill) экспериментирует с AI-расшифровкой своих специальных коллекций, которые активно используют люди, ищущие информацию о своих предках. Архивистка Джеки Дин рассказала, что модели хорошо работают с письмами и дневниками, но прорыв произошёл с таблицами — они всегда были бедой для специального софта. Федеральный резервный банк Филадельфии вообще вышел за рамки вузов.

Они используют LLM для извлечения данных из исторических реестров собственности и регистраций автомобилей, которые раньше было слишком дорого обрабатывать в масштабе. Это открыло новые возможности для исторических экономических исследований.

От чисел ЛеКуна к общим моделям История этой проблемы уходит корнями в самое начало AI.

В 1980-х годах Ян ЛеКун (позже ставший лауреатом Turing Award за вклад в deep learning) работал над распознаванием рукописных цифр. Его интересовала не столько сама рукопись, сколько компьютерное зрение — но из-за слабых вычислений и нехватки данных он сосредоточился на цифрах, где почтовая служба и переписи предоставили информацию. Оказалось, что на широком наборе данных, который видели современные LLM — интернет, книги, исторические оцифровки — модели где-то абсорбировали связь между рукописным текстом и его расшифровкой.

Никто их этому специально не учил. ЛеКун, который считает проблему в основном решённой и давно перешёл на более сложные вопросы машинного интеллекта, согласен с логикой. Хамфрис сейчас создаёт Archive Pearl — некоммерческий инструмент, находящийся в бета-версии.

Идея простая: перетащил сотню страниц, получил чистую расшифровку за минуты вместо недель. Цель Хамфриса — демократизация. Это должно быть инструмент для людей, не против них.

Что это значит

Рукописные архивы становятся доступнее не только для тренированных палеографов, но и для студентов, аспирантов, любителей истории и людей, ищущих свои корни. Коллекции, которые были сохранены, но функционально скрыты за трудозатратами расшифровки, становятся поисковыми. Вопросы, которые раньше были слишком дорогостоящими или трудоёмкими, теперь могут быть заданы. Это не просто ускорение — это переход от невозможного к рутинному.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Что вы думаете?
Загружаем комментарии…