Together AI na NVIDIA GTC 2026: Dynamo, modelos multiagentes e AI de voz

A Together AI fez quatro grandes anúncios na NVIDIA GTC 2026. A empresa integrou o NVIDIA Dynamo 1.0 ao seu stack de inferência e, em conjunto com a NVIDIA…

Redação da Hamidun News

Monitoramento de AI · Together AI Blog

30 de jun. de 2026· 2 min

Processado por IA de Together AI Blog; editado por Hamidun News

Together AI na NVIDIA GTC 2026: Dynamo, modelos multiagentes e AI de voz — Fonte: Together AI Blog. Colagem: Hamidun News.

◐ Ouvir artigo

A Together AI apareceu na NVIDIA GTC 2026 em San Jose com quatro grandes anúncios — de um novo engine de inferência até AI de voz e um poderoso modelo para fluxos de trabalho multi-agente. O tema principal da conferência se alinha com a direção estratégica da empresa: os sistemas de AI estão ficando mais abertos, agentivos e prontos para implantação industrial. Para desenvolvedores e equipes de AI, isso significa um novo nível de acessibilidade a ferramentas que anteriormente exigiam recursos significativos.

Dynamo 1.0 e infraestrutura agentiva

A NVIDIA lançou Dynamo 1.0 — um engine de software de código aberto para inferência generativa e agentiva em escala de produção. A Together AI já integrou o Dynamo em seu stack de inferência e o aplica ativamente para otimizar cargas de trabalho do mundo real.

De acordo com a empresa, isso permite alcançar maior desempenho ao processar requisições pesadas com custos mais baixos. Em paralelo, NVIDIA e Together AI lançaram em conjunto o NVIDIA NemoClaw — um stack de código aberto que simplifica a implantação de assistentes de AI com conexões persistentes. Em uma única implantação, ele configura o NVIDIA OpenShell — um ambiente seguro para executar agentes autônomos — e oferece acesso a modelos abertos, incluindo NVIDIA Nemotron.

Para desenvolvedores que constroem sistemas agentivos, isso significa acesso direto à biblioteca da Together com 150+ modelos otimizados com endpoints dedicados escalados para cargas de trabalho de produção. A combinação de NemoClaw e infraestrutura dedicada da Together reduz a barreira de entrada para equipes que desejam lançar produtos de AI agentivos sem configuração prolongada.

Nemotron 3 Super: raciocínio complexo e tarefas multi-agente

O NVIDIA Nemotron 3 Super é um modelo híbrido mixture-of-experts construído na arquitetura Mamba-Transformer. Foi especificamente projetado para tarefas complexas com horizontes de raciocínio longos e cenários onde múltiplos agentes interagem em um único fluxo de trabalho.

Características principais do modelo:

120B parâmetros no total — com apenas 12B ativos por token, reduzindo significativamente a sobrecarga computacional
Janela de contexto de 1 milhão de tokens para tarefas de raciocínio de longo horizonte
Otimização para operação multi-agente paralela — até mesmo em uma única GPU
Aplicações: desenvolvimento de software, análise financeira, automação de cibersegurança

O modelo está disponível através do Dedicated Model Inference da Together AI. Desenvolvedores obtêm uma forma simples e escalável de executar modelos avançados de raciocínio em produção sem construir infraestrutura personalizada do zero.

AI de Voz: Parakeet para transcrição em tempo real

Um anúncio separado foi a chegada do NVIDIA Parakeet TDT 0.6B V3 na biblioteca de modelos da Together AI. Este é um modelo ASR (reconhecimento automático de fala) com baixa latência otimizado para aplicações em tempo real. O Parakeet traz alta precisão de transcrição combinada com o desempenho exigido por agentes conversacionais de AI. Combinado com a infraestrutura de inferência de alto desempenho da Together, os desenvolvedores obtêm um stack pronto para construir agentes de voz — desde transcrição precisa até manipulação escalável de requisições. As aplicações potenciais abrangem interfaces de voz em suporte ao cliente, saúde, educação e comunicações corporativas, onde a velocidade e confiabilidade do reconhecimento são críticas.

"Os sistemas de AI estão ficando mais abertos, agentivos e prontos para produção" —

Together AI sobre o tema principal da GTC 2026.

Na conferência, a equipe da Together AI também conduziu sessões técnicas com clientes — incluindo Cursor (um assistente de AI para desenvolvedores) e Decagon (automação de suporte ao cliente) — demonstrando aplicações práticas da plataforma em desenvolvimento de software e automação de processos de negócios.

O que isso significa

A Together AI está consistentemente fortalecendo sua posição como "AI Native Cloud" — uma plataforma unificada onde modelos abertos, infraestrutura agentiva e AI de voz estão disponíveis para desenvolvedores a partir de um único ponto. A integração estreita com o ecossistema NVIDIA através de Dynamo, NemoClaw e Parakeet torna Together uma alternativa real a soluções fechadas para equipes que valorizam flexibilidade de infraestrutura, custos previsíveis e controle total sobre os modelos utilizados.

Hamidun News

Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Canal do Telegram RSS hamidun.com

Precisa de IA funcionando dentro da sua empresa — não só no feed de notícias?

Eu construo IA em produção para empresas — CRM sob medida, ferramentas internas, agentes autônomos, automação de processos. Pertence a você, moldada ao seu processo, sem taxa por usuário. Feito por Zhemal Khamidun, CPO da AlpinaGPT (plataforma de IA, 6.000+ usuários).

Agendar consultoria grátis →