JetBrains a lancé Mellum2 — un modèle MoE ouvert de 12B pour les tâches rapides dans les pipelines AI
JetBrains a lancé Mellum2, un modèle AI spécialisé pour les développeurs, sous licence Apache 2.0. Mellum2 repose sur une architecture Mixture of Experts de…
Traité par IA depuis MarkTechPost ; édité par Hamidun News
JetBrains — компания, создавшая IDE-инструменты IntelliJ IDEA и PyCharm, которыми пользуются десятки миллионов разработчиков — выпустила Mellum2, обновлённую версию своей специализированной языковой модели. Mellum2 работает под лицензией Apache 2.0 и рассчитана на быструю обработку специализированных задач в составе многомодельных AI-пайплайнов. Mellum — собственная линейка языковых моделей JetBrains для задач программирования. Mellum2 — значимое обновление: новая MoE-архитектура, масштабированный объём обучающих данных и чёткое позиционирование как специализированного компонента для многомодельных систем.
Архитектура
MoE и масштаб обучения Mellum2 построена на архитектуре Mixture of Experts (MoE) с 12 миллиардами параметров. В отличие от классических dense-моделей, где при каждом запросе активируются все веса сети, MoE разбивает модель на специализированные «экспертные» блоки и активирует только часть из них в зависимости от типа токена. Это позволяет модели работать быстрее и экономичнее при той же ёмкости. Для предобучения JetBrains использовала корпус из 10,6 триллиона токенов — масштаб, сопоставимый с флагманскими открытыми моделями вроде LLaMA 3 от Meta. Для coding-модели объём данных принципиально важен: чем шире охват языков программирования, фреймворков и технической документации, тем точнее модель справляется с задачами в реальных кодовых базах.
Роль в многомодельных пайплайнах
Mellum2 не претендует на конкуренцию с универсальными ассистентами вроде Claude или GPT. Её проектировали как быстрый специализированный компонент для конкретных шагов в рабочих процессах разработчика: автодополнение кода в реальном времени прямо в IDE быстрый рефакторинг небольших функций и блоков кода классификация запросов и маршрутизация внутри AI-агентов генерация комментариев и inline-документации * выполнение «дешёвых» промежуточных шагов перед передачей задачи более крупной модели Последний сценарий — ключевой. Production AI-системы для разработки всё чаще строятся как «оркестры моделей»: лёгкая быстрая модель обрабатывает рутинные запросы с минимальной задержкой, тяжёлая флагманская подключается только для сложных задач, требующих глубокого рассуждения. Mellum2 создана именно для роли быстрого специалиста в таких конвейерах.
Открытая лицензия Apache 2.0 Apache 2.0 — одна из наиболее либеральных открытых лицензий.
Mellum2 можно встраивать в закрытые корпоративные продукты, дообучать на проприетарных данных и использовать в коммерческих сервисах без уплаты роялти JetBrains. Компания публикует веса модели в открытом доступе. Среди coding-моделей с открытыми весами существует заметная конкуренция: Code Llama от Meta, DeepSeek-Coder, StarCoder, Qwen2.5-Coder. Mellum2 входит в это пространство с конкретным позиционированием — глубокая интеграция в IDE-экосистему JetBrains и роль специализированного компонента в многоэтапных пайплайнах, а не попытка обогнать флагманов по общим бенчмаркам кодогенерации.
Что это значит
Mellum2 — свидетельство важного тренда: компании, создающие инструменты для разработчиков, перестают покупать AI у внешних провайдеров и начинают обучать собственные специализированные модели под конкретные сценарии своих пользователей. JetBrains делает ставку на то, что глубокая интеграция с IDE и отраслевая специализация важнее абстрактного превосходства в универсальных бенчмарках. Для разработчика это означает более быстрые AI-подсказки прямо в привычном редакторе — без задержек облачного API и без необходимости отправлять собственный код на сторонние серверы. *Meta признана экстремистской организацией и запрещена в РФ.
Besoin d'une IA qui travaille dans votre entreprise — pas seulement dans votre fil d'actualité?
Je construis de l'IA en production pour les entreprises — CRM sur mesure, outils internes, agents autonomes, automatisation des processus. Vous en êtes propriétaire, adaptée à votre processus, sans coût par utilisateur. Réalisé par Zhemal Khamidun, CPO d'AlpinaGPT (plateforme IA, 6 000+ utilisateurs).
L'essentiel de l'IA — une fois par semaine
Sept actus qui ont vraiment compté, choisies à la main. Sans bruit ni communiqués.
C'est fait ! Vérifiez votre boîte mail pour la confirmation.