Mistral AI выпустила Leanstral 1.5: бесплатная ИИ-модель побила рекорды формальной верификации
Mistral AI 2 июля 2026 года представила Leanstral 1.5 — бесплатную модель формальной верификации под лицензией Apache 2.0. При 6 млрд активных параметрах она…
AI-обработка оригинала Mistral AI News; редакция Hamidun News
Mistral AI 2 июля 2026 года представила Leanstral 1.5 — обновлённую модель для формальной верификации с 6 млрд активных параметров, распространяемую бесплатно под лицензией Apache 2.0. Модель полностью насытила бенчмарк miniF2F, решила 587 из 672 задач PutnamBench и установила рекорды на FATE-H (87%) и FATE-X (34%).
Что умеет
Leanstral 1.5 Модель специализируется на формальном доказательстве теорем в языке Lean 4 и верификации кода в реальных репозиториях. Ключевые результаты релиза: 100% на miniF2F — полное насыщение на обеих выборках (валидационной и тестовой) 587 из 672 задач PutnamBench — на 7 больше, чем у конкурента Seed-Prover 1.5 87% на FATE-H и 34% на FATE-X — новые рекорды на задачах аспирантского и докторского уровней Около $4 за задачу против $300 у Seed-Prover 1.5 в режиме high * 5 ранее неизвестных ошибок, найденных в 57 открытых репозиториях Отдельно модель тестировалась на бенчмарке FLTEval, основанном на реальных pull request'ах из репозитория доказательства Великой теоремы Ферма, — это подтверждает применимость к задачам промышленного масштаба.
Как устроено обучение
Leanstral 1.5 прошла три этапа подготовки: предварительное дообучение, обучение с учителем и обучение с подкреплением по методу CISPO. На последнем этапе модель тренировалась в двух окружениях. В многошаговом окружении Leanstral получает формулировку теоремы, отправляет попытку доказательства, получает обратную связь от Lean-компилятора и итерирует до победы или исчерпания вычислительного бюджета. В агентном окружении модель работает как разработчик в реальной файловой системе: редактирует файлы, выполняет bash-команды и в реальном времени обращается к языковому серверу Lean для инспекции целей, ошибок и типовой информации. Этот режим позволяет решать длинные задачи: дополнять частичные доказательства в репозиториях, строить вспомогательные леммы и сохранять прогресс через несколько раундов уплотнения контекста.
Почему это важно
Формальная верификация — одна из наиболее требовательных задач для языковых моделей: успех требует математической безупречности и длинных цепочек рассуждений. Мощные решения в этой области прежде были либо дорогостоящими, либо закрытыми. Leanstral 1.5 меняет это соотношение. Архитектура Mixture of Experts с 119 млрд суммарных и всего 6 млрд активных параметров делает вывод экономичным. Лицензия Apache 2.0 допускает коммерческое применение без ограничений.
«Строгие формальные методы могут быть одновременно эффективными и практичными для реального использования», — команда
Leanstral в Mistral AI.
Что это значит
Mistral AI открывает доступ к инструменту формальной верификации, который по соотношению цена/качество опережает закрытых конкурентов. Публикация на Hugging Face и бесплатный API снижают порог входа для исследователей и разработчиков и могут ускорить проникновение формальных методов в промышленную разработку программного обеспечения.
Частые вопросы ### Где можно получить доступ к Leanstral 1.5?
Модель опубликована на Hugging Face под лицензией Apache 2.0 и доступна через бесплатный API Mistral AI. Коммерческое использование разрешено без дополнительных условий.
Сколько стоит работа с Leanstral 1.5?
Около $4 за доказательство одной задачи. Seed-Prover 1.5 в режиме high расходует 10 GPU-дней на процессорах H20 и обходится примерно в $300 за задачу — разница в 75 раз.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.
Главное из мира ИИ — раз в неделю
7 ключевых событий недели, отобранных вручную. Без шума, репостов и пресс-релизов.
Готово! Проверьте почту — мы отправили подтверждение.