Together AI на NVIDIA GTC 2026: Dynamo, мультиагентные модели и голосовой AI
Together AI вышла на NVIDIA GTC 2026 с четырьмя крупными анонсами. Компания интегрировала NVIDIA Dynamo 1.0 в свой inference-стек и совместно с NVIDIA…
AI-обработка оригинала Together AI Blog; редакция Hamidun News
Together AI появилась на NVIDIA GTC 2026 в Сан-Хосе с четырьмя крупными анонсами — от нового inference-движка до голосового AI и мощной модели для мультиагентных рабочих процессов. Главная тема конференции совпадает со стратегическим курсом компании: AI-системы становятся более открытыми, агентными и готовыми к промышленной эксплуатации. Для разработчиков и AI-команд это означает новый уровень доступности инструментов, которые раньше требовали значительных ресурсов.
Dynamo 1.0 и агентная инфраструктура NVIDIA выпустила
Dynamo 1.0 — открытый программный движок для generative и agentic inference в production-масштабе. Together AI уже интегрировала Dynamo в свой inference-стек и активно применяет его для оптимизации реальных рабочих нагрузок.
По данным компании, это позволяет добиваться более высокой производительности при обработке тяжёлых запросов с меньшими затратами. Параллельно NVIDIA и Together AI совместно запустили NVIDIA NemoClaw — open-source стек, упрощающий развёртывание AI-ассистентов с постоянным соединением. Одной командой он устанавливает NVIDIA OpenShell — защищённую среду для запуска автономных агентов — и открывает доступ к открытым моделям, включая NVIDIA Nemotron.
Для разработчиков, создающих агентные системы, это означает прямой доступ к библиотеке из 150+ оптимизированных моделей Together с выделенными endpoint'ами, рассчитанными на production-нагрузку. Сочетание NemoClaw и dedicated-инфраструктуры Together снижает порог входа для команд, которые хотят запустить агентные AI-продукты без долгой настройки.
Nemotron 3
Super: сложные рассуждения и мультиагентные задачи NVIDIA Nemotron 3 Super — гибридная mixture-of-experts модель на архитектуре Mamba-Transformer. Она спроектирована специально для сложных задач с длинным горизонтом рассуждений и сценариев, в которых несколько агентов взаимодействуют в рамках одного рабочего процесса. Ключевые характеристики модели: 120B параметров суммарно — при этом активны лишь 12B на каждый токен, что существенно снижает вычислительную нагрузку Контекстное окно 1 млн токенов для задач с длинным горизонтом рассуждений Оптимизация под параллельную работу нескольких агентов — даже на одном GPU Применения: разработка программного обеспечения, финансовый анализ, автоматизация в кибербезопасности Модель доступна через Dedicated Model Inference Together AI.
Разработчики получают простой и масштабируемый способ запускать продвинутые reasoning-модели в production без необходимости выстраивать собственную инфраструктуру с нуля.
Голосовой AI:
Parakeet для real-time транскрипции Отдельным анонсом стало появление NVIDIA Parakeet TDT 0.6B V3 в библиотеке моделей Together AI. Это ASR-модель (автоматическое распознавание речи) с низкой задержкой, оптимизированная для приложений реального времени. Parakeet привносит высокую точность транскрипции в сочетании с производительностью, которой требуют разговорные AI-агенты. В связке с высокопроизводительной inference-инфраструктурой Together разработчики получают готовый стек для создания голосовых агентов — от точной транскрипции до масштабируемого обслуживания запросов. Потенциальные применения охватывают голосовые интерфейсы в клиентской поддержке, медицине, образовании и корпоративных коммуникациях, где критически важны скорость и надёжность распознавания.
«AI-системы становятся более открытыми, агентными и готовыми к production» — Together AI о главной теме GTC 2026.
На конференции команда Together AI также провела технические сессии совместно с клиентами — в том числе Cursor (AI-ассистент для разработчиков) и Decagon (автоматизация клиентской поддержки), — демонстрируя реальные применения платформы в разработке ПО и автоматизации бизнес-процессов.
Что это значит
Together AI последовательно укрепляет позицию «AI Native Cloud» — единой платформы, где открытые модели, агентная инфраструктура и голосовой AI доступны разработчикам из одной точки. Плотная интеграция с экосистемой NVIDIA через Dynamo, NemoClaw и Parakeet делает Together реальной альтернативой закрытым решениям для команд, которым важны гибкость инфраструктуры, предсказуемая стоимость и полный контроль над используемыми моделями.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.
Главное из мира ИИ — раз в неделю
7 ключевых событий недели, отобранных вручную. Без шума, репостов и пресс-релизов.
Готово! Проверьте почту — мы отправили подтверждение.