Mistral представила Small 4 — модель, объединившую рассуждение, код и видение

Q: Источник материала?

Оригинальная публикация на Mistral AI News. Hamidun News обрабатывает и адаптирует материалы с помощью AI.

Q: Когда опубликовано?

2026-05-29. Время чтения: 4 мин.

Mistral выпустила Small 4 — объединённую модель, которая заменяет три специализированные системы: Magistral для рассуждений, Pixtral для видения и Devstral для

ЖХ

Редакция Hamidun News

AI‑мониторинг · Mistral AI News

2026-05-29· 3 мин

Mistral представила Small 4 — модель, объединившую рассуждение, код и видение — Источник: Mistral AI News. Коллаж: Hamidun News.

◐ Слушать статью

Mistral AI представила Mistral Small 4 — модель, которая объединяет в одной системе три отдельные специализированные модели: Magistral для сложных рассуждений, Pixtral для анализа изображений и Devstral для кода. До сих пор разработчикам приходилось выбирать, какую модель использовать для конкретной задачи. Теперь один универсальный вариант решает все проблемы без необходимости переключаться между системами.

Единая модель вместо трёх

Mistral Small 4 — это гибридная архитектура, оптимизированная для чата, кодирования, агентских задач и сложных рассуждений. Она поддерживает как текстовые, так и графические входы, что открывает широкий спектр применений: от разговорников и документооборота до анализа визуальной информации и создания autonomous agents. Компания отмечает, что выпуск Small 4 подтверждает её приверженность открытому исходному коду — модель распространяется под лицензией Apache 2.0. Mistral гордится, что присоединилась к NVIDIA Nemotron Coalition в качестве учредителя, продвигая сотрудничество и инновации в разработке AI. Это знак того, что индустрия движется в сторону открытых, модульных решений, которые компании могут адаптировать под свои нужды.

Что внутри модели

Архитектура построена на современных принципах масштабируемости и эффективности: Mixture of Experts (MoE): 128 экспертов с 4 активными одновременно на токен — эффективное распределение вычислений без загрузки всех параметров Параметры: 119B всего, 6B активных на токен (8B включая слои embedding и output) Контекст: 256k токенов — поддержка длинных документов, многостраничных отчётов и анализа Мультимодальность: встроенная поддержка текста и изображений без модулей-переходников * Гибкое мышление: параметр reasoning_effort позволяет менять глубину анализа под задачу Такая конструкция позволяет модели масштабироваться без просадки эффективности. На токен активно только 6B параметров, что снижает требования к памяти и ускоряет инференс. По сравнению с традиционными 120B моделями, Small 4 экономит вычислительные ресурсы благодаря expert routing — каждый токен идёт только к нужным экспертам.

Reasoning на лету

Главное нововведение — параметр reasoning_effort, который позволяет динамически менять поведение модели под конкретную задачу. Если reasoning_effort="none", модель отвечает максимально быстро, как Mistral Small 3.2. Если reasoning_effort="high", переходит в режим глубокого пошагового анализа, эквивалентный прежним версиям Magistral для сложных рассуждений. Благодаря этому одна модель может работать и как быстрый чатбот для повседневных задач, и как исследовательский партнёр для сложных аналитических задач. Это особенно удобно для enterprise-систем, где не все запросы требуют глубокого анализа, и излишняя вычислительная мощь ведёт к напрасным затратам. Разработчики могут даже настроить промежуточные уровни reasoning, если стандартные режимы не подходят.

Производительность и оптимизация В режиме оптимизации по скорости (low-latency setup)

Small 4 работает на 40% быстрее предшественников — минимальные задержки при ответе. В режиме пропускной способности (throughput-optimized) система обрабатывает в 3 раза больше запросов в секунду, чем Mistral Small 3. Оптимизацией инференса занимались совместно с NVIDIA. Модель полностью оптимизирована для vLLM и SGLang, что гарантирует эффективное высокопроизводительное развёртывание в разных инфраструктурных сценариях. Разработчики получили доступ на vLLM, llama.cpp, SGLang и Transformers, что упрощает интеграцию в существующие pipelines. Минимальная инфраструктура для развёртывания: 4 NVIDIA HGX H100, 2 NVIDIA HGX H200 или 1 NVIDIA DGX B200. Для максимальной производительности рекомендуется удвоить эти ресурсы.

Что это значит Mistral Small 4 — сигнал того, что эра специализированных моделей подходит к концу.

В будущем один универсальный вариант с настраиваемыми параметрами может заменить целую полку специализированных инструментов. Для разработчиков это упрощение: не нужно выбирать и переключаться между моделями. Для компаний — снижение сложности архитектуры, развёртывания и поддержки системы.

ЖХ

Hamidun News

AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Telegram-канал RSS hamidun.com