Mistral AI представила Mistral 3: новая серия моделей с Mistral Large 3
Mistral AI выпустила серию Mistral 3 — от компактных Ministral (3B, 8B, 14B) для локального использования на ноутбуках, роботах и IoT-устройствах до мощного Mis

Mistral AI представила Mistral 3 — новую серию открытых языковых моделей разных размеров. В семейство входят компактные Ministral 3 (3B, 8B, 14B) для локального использования и мощный Mistral Large 3 (675B параметров) для сложных задач. Все модели выпущены под Apache 2.0 и поддерживают работу с текстом, изображениями и многоязычными запросами.
Mistral
Large 3: новая граница Mistral Large 3 — флагман серии, обученный на 3000 GPU NVIDIA H200 с нуля. Это первая модель Mistral на архитектуре sparse mixture-of-experts (MoE) с 41B активных параметров из 675B общего числа. На тестах LMArena Mistral Large 3 занимает второе место среди открытых языковых моделей и демонстрирует результаты, сопоставимые с лучшими инструкцион-туненными моделями на рынке.
Ключевое отличие MoE-архитектуры в том, что модель не использует все параметры одновременно. Вместо этого различные части сети активируются для разных типов запросов — это делает инференс быстрее и дешевле, чем полное использование 675B параметров. Такой подход позволяет масштабировать модели без пропорционального роста требований к вычислительным ресурсам.
Модель демонстрирует особенно сильные результаты в многоязычных задачах и понимании изображений. Компания обещает скоро выпустить версию с расширенными способностями к логическому мышлению и более глубокому анализу сложных проблем.
Партнёрство с NVIDIA для скорости и масштабирования
Mistral работала с NVIDIA, vLLM и Red Hat для оптимизации инференса и развёртывания моделей. Все модели Mistral 3 обучены на GPU NVIDIA Hopper, что позволило использовать высокополосную память HBM3e — критическую компоненту для работы с такими массивными нейросетями. NVIDIA создала специализированные оптимизации в TensorRT-LLM и SGLang для эффективного выполнения инструкций.
Для Mistral Large 3 добавлена поддержка эффективных ядер Blackwell и улучшена архитектура attention/MoE для длинных контекстов на системах GB200 NVL72. Это позволяет обслуживать высокопроизводительные нагрузки с минимальной задержкой. Компактные модели Ministral легко развернуть на локальных машинах: На DGX Spark для enterprise-решений На RTX PC и ноутбуках для разработки На Jetson-устройствах для IoT и робототехники Поддержка развёртывания от облачной инфраструктуры до edge-устройств Эта вертикальная интеграция означает, что разработчики получают единый путь для запуска одних и тех же моделей от датацентра до локальных edge-устройств без переписывания кода.
Ministral 3: мощный инструмент для edge
Для edge-вычислений и локального использования Mistral выпустила Ministral 3 в трёх размерах: 3B, 8B и 14B параметров. Каждый размер доступен в трёх вариантах: базовая модель, инструкцион-туненная версия для выполнения инструкций и версия с расширенными способностями к логическому мышлению. Все варианты поддерживают работу с изображениями и текстом на 30+ языках, включая тюркские языки и русский. Несмотря на компактность, Ministral 3 обеспечивает лучший в индустрии баланс производительности и стоимости среди открытых моделей. Это критично для компаний, которые хотят запускать AI локально без облачных сервисов.
Что это значит для AI-индустрии Открытые языковые модели становятся практичнее и доступнее.
С Apache 2.0 лицензией любой может использовать, модифицировать и развивать модели Mistral в коммерческих проектах без ограничений. Для разработчиков это означает больше гибкости в выборе стека, для предприятий — снижение затрат на AI-инфраструктуру и меньше зависимости от облачных провайдеров. Mistral 3 может стать переломным моментом в движении к независимым, локально управляемым AI-системам.