NVIDIA представила Nemotron 3 Super — открытую модель со 120 млрд параметров
Компания из Санта-Клары выпустила Nemotron 3 Super — открытую языковую модель со 120 миллиардами параметров, созданную специально для сложных мультиагентных при

NVIDIA представила Nemotron 3 Super — открытую модель со 120 млрд параметров
Разрыв между закрытыми коммерческими системами и открытыми языковыми моделями сокращается с такой скоростью, что ещё несколько лет назад это показалось бы невозможным. NVIDIA, компания, чьё имя давно стало синонимом аппаратного превосходства в эпоху искусственного интеллекта, делает всё более уверенные шаги и в программном пространстве. Её новый релиз — Nemotron 3 Super с 120 миллиардами параметров — претендует не просто на место в таблице лидеров, но на переопределение самой логики построения открытых моделей для агентных задач.
Чтобы понять значимость этого выпуска, необходимо взглянуть на контекст. На протяжении последних двух лет открытые модели развивались стремительно, однако всегда уступали закрытым аналогам в нескольких ключевых характеристиках: производительности на сложных многошаговых задачах, скорости инференса и способности эффективно работать в мультиагентных сценариях. GPT-4, Claude и Gemini долгое время удерживали качественный отрыв именно в этих областях. Nemotron 3 Super создавался как ответ на этот разрыв — не компромисс между открытостью и качеством, а попытка устранить саму необходимость такого компромисса.
Техническое решение, лежащее в основе модели, заслуживает отдельного внимания. NVIDIA применила гибридную архитектуру, в которой механизм Mamba — эффективная альтернатива классическому трансформеру при работе с длинными последовательностями — объединён с традиционным механизмом Attention. Поверх этого наложен подход Mixture-of-Experts, позволяющий активировать лишь часть параметров при каждом обращении к модели. Результатом стал пятикратный прирост пропускной способности по сравнению с архитектурными аналогами того же весового класса. Это не маркетинговый показатель: в реальных агентных системах, где модель обрабатывает десятки параллельных запросов и управляет цепочками инструментов, именно скорость инференса нередко становится узким местом всей системы.
В продуктовой линейке NVIDIA Nemotron 3 Super занимает продуманную промежуточную позицию. Компактная версия на 30 миллиардов параметров ориентирована на развёртывание с ограниченными ресурсами и локальные приложения. Более крупные решения — для задач, требующих максимальной глубины рассуждений. Nemotron 3 Super закрывает пространство между ними: достаточно мощная для сложных корпоративных сценариев, достаточно эффективная, чтобы не требовать гигантских инфраструктурных затрат. Такое позиционирование говорит о том, что NVIDIA проектирует не отдельный продукт, а экосистему, в которой каждый компонент решает свою задачу без избыточности.
Последствия этого релиза выходят далеко за рамки технической дискуссии. Прежде всего, он усиливает давление на OpenAI, Anthropic и Google в сегменте корпоративных клиентов. Компании, которые ранее выбирали закрытые API из соображений качества, теперь получают аргумент в пользу перехода на открытые решения: полный контроль над данными, возможность тонкой настройки и отсутствие зависимости от внешнего провайдера. Для чувствительных к конфиденциальности отраслей — финансов, здравоохранения, государственного сектора — это может оказаться решающим фактором при выборе инфраструктуры.
Не менее важен сигнал, который Nemotron 3 Super посылает исследовательскому сообществу. Открытость весов означает возможность воспроизведения, аудита и доработки — то, чего закрытые модели принципиально лишены. Если гибридная архитектура Mamba-Attention действительно обеспечивает заявленный прирост эффективности, она способна стать новым стандартом для следующего поколения открытых систем. NVIDIA, по сути, публикует не просто модель, но архитектурный ориентир.
Релиз Nemotron 3 Super фиксирует момент, когда открытый ИИ перестаёт быть синонимом «достаточно хорошего» и начинает претендовать на роль лучшего в своём классе. NVIDIA умело конвертирует своё доминирование в аппаратном пространстве в программный авторитет, формируя полный стек — от чипов до весов модели. Для рынка это означает усиление конкуренции и, как следствие, ускорение прогресса. Для разработчиков — расширение реального выбора. А для всей отрасли — подтверждение того, что наиболее захватывающая гонка в искусственном интеллекте сегодня разворачивается не за закрытыми дверями лабораторий, а в открытом доступе.