Mistral AI News→ original

Mistral AI представила Mistral 3: новая серия моделей с Mistral Large 3

Mistral AI выпустила серию Mistral 3 — от компактных Ministral (3B, 8B, 14B) для локального использования на ноутбуках, роботах и IoT-устройствах до мощного Mis

Procesado por IA desde Mistral AI News; editado por Hamidun News
Mistral AI представила Mistral 3: новая серия моделей с Mistral Large 3
Fuente: Mistral AI News. Collage: Hamidun News.

Mistral AI представила Mistral 3 — новую серию открытых языковых моделей разных размеров. В семейство входят компактные Ministral 3 (3B, 8B, 14B) для локального использования и мощный Mistral Large 3 (675B параметров) для сложных задач. Все модели выпущены под Apache 2.0 и поддерживают работу с текстом, изображениями и многоязычными запросами.

Mistral

Large 3: новая граница Mistral Large 3 — флагман серии, обученный на 3000 GPU NVIDIA H200 с нуля. Это первая модель Mistral на архитектуре sparse mixture-of-experts (MoE) с 41B активных параметров из 675B общего числа. На тестах LMArena Mistral Large 3 занимает второе место среди открытых языковых моделей и демонстрирует результаты, сопоставимые с лучшими инструкцион-туненными моделями на рынке.

Ключевое отличие MoE-архитектуры в том, что модель не использует все параметры одновременно. Вместо этого различные части сети активируются для разных типов запросов — это делает инференс быстрее и дешевле, чем полное использование 675B параметров. Такой подход позволяет масштабировать модели без пропорционального роста требований к вычислительным ресурсам.

Модель демонстрирует особенно сильные результаты в многоязычных задачах и понимании изображений. Компания обещает скоро выпустить версию с расширенными способностями к логическому мышлению и более глубокому анализу сложных проблем.

Партнёрство с NVIDIA для скорости и масштабирования

Mistral работала с NVIDIA, vLLM и Red Hat для оптимизации инференса и развёртывания моделей. Все модели Mistral 3 обучены на GPU NVIDIA Hopper, что позволило использовать высокополосную память HBM3e — критическую компоненту для работы с такими массивными нейросетями. NVIDIA создала специализированные оптимизации в TensorRT-LLM и SGLang для эффективного выполнения инструкций.

Для Mistral Large 3 добавлена поддержка эффективных ядер Blackwell и улучшена архитектура attention/MoE для длинных контекстов на системах GB200 NVL72. Это позволяет обслуживать высокопроизводительные нагрузки с минимальной задержкой. Компактные модели Ministral легко развернуть на локальных машинах: На DGX Spark для enterprise-решений На RTX PC и ноутбуках для разработки На Jetson-устройствах для IoT и робототехники Поддержка развёртывания от облачной инфраструктуры до edge-устройств Эта вертикальная интеграция означает, что разработчики получают единый путь для запуска одних и тех же моделей от датацентра до локальных edge-устройств без переписывания кода.

Ministral 3: мощный инструмент для edge

Для edge-вычислений и локального использования Mistral выпустила Ministral 3 в трёх размерах: 3B, 8B и 14B параметров. Каждый размер доступен в трёх вариантах: базовая модель, инструкцион-туненная версия для выполнения инструкций и версия с расширенными способностями к логическому мышлению. Все варианты поддерживают работу с изображениями и текстом на 30+ языках, включая тюркские языки и русский. Несмотря на компактность, Ministral 3 обеспечивает лучший в индустрии баланс производительности и стоимости среди открытых моделей. Это критично для компаний, которые хотят запускать AI локально без облачных сервисов.

Что это значит для AI-индустрии Открытые языковые модели становятся практичнее и доступнее.

С Apache 2.0 лицензией любой может использовать, модифицировать и развивать модели Mistral в коммерческих проектах без ограничений. Для разработчиков это означает больше гибкости в выборе стека, для предприятий — снижение затрат на AI-инфраструктуру и меньше зависимости от облачных провайдеров. Mistral 3 может стать переломным моментом в движении к независимым, локально управляемым AI-системам.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…