Together AI Blog→ оригинал

Together AI на NVIDIA GTC 2026: Dynamo, мультиагентные модели и голосовой AI

Together AI вышла на NVIDIA GTC 2026 с четырьмя крупными анонсами. Компания интегрировала NVIDIA Dynamo 1.0 в свой inference-стек и совместно с NVIDIA…

AI-обработка оригинала Together AI Blog; редакция Hamidun News
Together AI на NVIDIA GTC 2026: Dynamo, мультиагентные модели и голосовой AI
Источник: Together AI Blog. Коллаж: Hamidun News.
◐ Слушать статью

Together AI появилась на NVIDIA GTC 2026 в Сан-Хосе с четырьмя крупными анонсами — от нового inference-движка до голосового AI и мощной модели для мультиагентных рабочих процессов. Главная тема конференции совпадает со стратегическим курсом компании: AI-системы становятся более открытыми, агентными и готовыми к промышленной эксплуатации. Для разработчиков и AI-команд это означает новый уровень доступности инструментов, которые раньше требовали значительных ресурсов.

Dynamo 1.0 и агентная инфраструктура NVIDIA выпустила

Dynamo 1.0 — открытый программный движок для generative и agentic inference в production-масштабе. Together AI уже интегрировала Dynamo в свой inference-стек и активно применяет его для оптимизации реальных рабочих нагрузок.

По данным компании, это позволяет добиваться более высокой производительности при обработке тяжёлых запросов с меньшими затратами. Параллельно NVIDIA и Together AI совместно запустили NVIDIA NemoClaw — open-source стек, упрощающий развёртывание AI-ассистентов с постоянным соединением. Одной командой он устанавливает NVIDIA OpenShell — защищённую среду для запуска автономных агентов — и открывает доступ к открытым моделям, включая NVIDIA Nemotron.

Для разработчиков, создающих агентные системы, это означает прямой доступ к библиотеке из 150+ оптимизированных моделей Together с выделенными endpoint'ами, рассчитанными на production-нагрузку. Сочетание NemoClaw и dedicated-инфраструктуры Together снижает порог входа для команд, которые хотят запустить агентные AI-продукты без долгой настройки.

Nemotron 3

Super: сложные рассуждения и мультиагентные задачи NVIDIA Nemotron 3 Super — гибридная mixture-of-experts модель на архитектуре Mamba-Transformer. Она спроектирована специально для сложных задач с длинным горизонтом рассуждений и сценариев, в которых несколько агентов взаимодействуют в рамках одного рабочего процесса. Ключевые характеристики модели: 120B параметров суммарно — при этом активны лишь 12B на каждый токен, что существенно снижает вычислительную нагрузку Контекстное окно 1 млн токенов для задач с длинным горизонтом рассуждений Оптимизация под параллельную работу нескольких агентов — даже на одном GPU Применения: разработка программного обеспечения, финансовый анализ, автоматизация в кибербезопасности Модель доступна через Dedicated Model Inference Together AI.

Разработчики получают простой и масштабируемый способ запускать продвинутые reasoning-модели в production без необходимости выстраивать собственную инфраструктуру с нуля.

Голосовой AI:

Parakeet для real-time транскрипции Отдельным анонсом стало появление NVIDIA Parakeet TDT 0.6B V3 в библиотеке моделей Together AI. Это ASR-модель (автоматическое распознавание речи) с низкой задержкой, оптимизированная для приложений реального времени. Parakeet привносит высокую точность транскрипции в сочетании с производительностью, которой требуют разговорные AI-агенты. В связке с высокопроизводительной inference-инфраструктурой Together разработчики получают готовый стек для создания голосовых агентов — от точной транскрипции до масштабируемого обслуживания запросов. Потенциальные применения охватывают голосовые интерфейсы в клиентской поддержке, медицине, образовании и корпоративных коммуникациях, где критически важны скорость и надёжность распознавания.

«AI-системы становятся более открытыми, агентными и готовыми к production» — Together AI о главной теме GTC 2026.

На конференции команда Together AI также провела технические сессии совместно с клиентами — в том числе Cursor (AI-ассистент для разработчиков) и Decagon (автоматизация клиентской поддержки), — демонстрируя реальные применения платформы в разработке ПО и автоматизации бизнес-процессов.

Что это значит

Together AI последовательно укрепляет позицию «AI Native Cloud» — единой платформы, где открытые модели, агентная инфраструктура и голосовой AI доступны разработчикам из одной точки. Плотная интеграция с экосистемой NVIDIA через Dynamo, NemoClaw и Parakeet делает Together реальной альтернативой закрытым решениям для команд, которым важны гибкость инфраструктуры, предсказуемая стоимость и полный контроль над используемыми моделями.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…