Mistral AI Lança Leanstral 1.5: Modelo IA Gratuito Quebra Recordes em Verificação Formal
Em 2 de julho de 2026, Mistral AI introduziu Leanstral 1.5 — um modelo gratuito de verificação formal sob licença Apache 2.0. Com 6 bilhões de parâmetros…
Processado por IA de Mistral AI News; editado por Hamidun News
Mistral AI 2 июля 2026 года представила Leanstral 1.5 — обновлённую модель для формальной верификации с 6 млрд активных параметров, распространяемую бесплатно под лицензией Apache 2.0. Модель полностью насытила бенчмарк miniF2F, решила 587 из 672 задач PutnamBench и установила рекорды на FATE-H (87%) и FATE-X (34%).
Что умеет
Leanstral 1.5 Модель специализируется на формальном доказательстве теорем в языке Lean 4 и верификации кода в реальных репозиториях. Ключевые результаты релиза: 100% на miniF2F — полное насыщение на обеих выборках (валидационной и тестовой) 587 из 672 задач PutnamBench — на 7 больше, чем у конкурента Seed-Prover 1.5 87% на FATE-H и 34% на FATE-X — новые рекорды на задачах аспирантского и докторского уровней Около $4 за задачу против $300 у Seed-Prover 1.5 в режиме high * 5 ранее неизвестных ошибок, найденных в 57 открытых репозиториях Отдельно модель тестировалась на бенчмарке FLTEval, основанном на реальных pull request'ах из репозитория доказательства Великой теоремы Ферма, — это подтверждает применимость к задачам промышленного масштаба.
Как устроено обучение
Leanstral 1.5 прошла три этапа подготовки: предварительное дообучение, обучение с учителем и обучение с подкреплением по методу CISPO. На последнем этапе модель тренировалась в двух окружениях. В многошаговом окружении Leanstral получает формулировку теоремы, отправляет попытку доказательства, получает обратную связь от Lean-компилятора и итерирует до победы или исчерпания вычислительного бюджета. В агентном окружении модель работает как разработчик в реальной файловой системе: редактирует файлы, выполняет bash-команды и в реальном времени обращается к языковому серверу Lean для инспекции целей, ошибок и типовой информации. Этот режим позволяет решать длинные задачи: дополнять частичные доказательства в репозиториях, строить вспомогательные леммы и сохранять прогресс через несколько раундов уплотнения контекста.
Почему это важно
Формальная верификация — одна из наиболее требовательных задач для языковых моделей: успех требует математической безупречности и длинных цепочек рассуждений. Мощные решения в этой области прежде были либо дорогостоящими, либо закрытыми. Leanstral 1.5 меняет это соотношение. Архитектура Mixture of Experts с 119 млрд суммарных и всего 6 млрд активных параметров делает вывод экономичным. Лицензия Apache 2.0 допускает коммерческое применение без ограничений.
«Строгие формальные методы могут быть одновременно эффективными и практичными для реального использования», — команда
Leanstral в Mistral AI.
Что это значит
Mistral AI открывает доступ к инструменту формальной верификации, который по соотношению цена/качество опережает закрытых конкурентов. Публикация на Hugging Face и бесплатный API снижают порог входа для исследователей и разработчиков и могут ускорить проникновение формальных методов в промышленную разработку программного обеспечения.
Частые вопросы ### Где можно получить доступ к Leanstral 1.5?
Модель опубликована на Hugging Face под лицензией Apache 2.0 и доступна через бесплатный API Mistral AI. Коммерческое использование разрешено без дополнительных условий.
Сколько стоит работа с Leanstral 1.5?
Около $4 за доказательство одной задачи. Seed-Prover 1.5 в режиме high расходует 10 GPU-дней на процессорах H20 и обходится примерно в $300 за задачу — разница в 75 раз.
Precisa de IA funcionando dentro da sua empresa — não só no feed de notícias?
Eu construo IA em produção para empresas — CRM sob medida, ferramentas internas, agentes autônomos, automação de processos. Pertence a você, moldada ao seu processo, sem taxa por usuário. Feito por Zhemal Khamidun, CPO da AlpinaGPT (plataforma de IA, 6.000+ usuários).
O essencial da IA — uma vez por semana
Sete histórias que realmente importaram, escolhidas a dedo. Sem ruído nem releases.
Pronto! Verifique seu e-mail para a confirmação.