Together AI à la NVIDIA GTC 2026 : Dynamo, modèles multi-agents et AI vocale

Together AI a fait quatre annonces majeures à la NVIDIA GTC 2026. L’entreprise a intégré NVIDIA Dynamo 1.0 à sa stack d’inférence et, avec NVIDIA, a lancé…

Rédaction de Hamidun News

Veille IA · Together AI Blog

30 juin 2026· 2 min

Traité par IA depuis Together AI Blog ; édité par Hamidun News

Together AI à la NVIDIA GTC 2026 : Dynamo, modèles multi-agents et AI vocale — Source : Together AI Blog. Collage: Hamidun News.

◐ Écouter l'article

Together AI a fait son apparition à NVIDIA GTC 2026 à San Jose avec quatre grandes annonces — d'un nouveau moteur d'inférence à l'IA vocale et un puissant modèle pour les flux de travail multi-agents. Le thème principal de la conférence s'aligne avec la direction stratégique de l'entreprise : les systèmes d'IA deviennent plus ouverts, agentifs et prêts pour le déploiement industriel. Pour les développeurs et les équipes d'IA, cela signifie un nouveau niveau d'accessibilité aux outils qui nécessitaient auparavant des ressources considérables.

Dynamo 1.0 et infrastructure agentive

NVIDIA a lancé Dynamo 1.0 — un moteur logiciel open-source pour l'inférence générative et agentive à l'échelle de la production. Together AI a déjà intégré Dynamo dans sa pile d'inférence et l'applique activement pour optimiser les charges de travail du monde réel.

Selon l'entreprise, cela permet d'obtenir des performances plus élevées lors du traitement de requêtes lourdes avec des coûts réduits. En parallèle, NVIDIA et Together AI ont lancé conjointement NVIDIA NemoClaw — une pile open-source qui simplifie le déploiement des assistants IA avec des connexions persistantes. En un seul déploiement, il configure NVIDIA OpenShell — un environnement sécurisé pour exécuter des agents autonomes — et fournit un accès à des modèles ouverts, notamment NVIDIA Nemotron.

Pour les développeurs créant des systèmes agentifs, cela signifie un accès direct à la bibliothèque de Together contenant 150+ modèles optimisés avec des endpoints dédiés dimensionnés pour les charges de travail de production. La combinaison de NemoClaw et de l'infrastructure dédiée de Together abaisse la barrière à l'entrée pour les équipes qui souhaitent lancer des produits IA agentifs sans configuration prolongée.

Nemotron 3

Super : raisonnement complexe et tâches multi-agents

NVIDIA Nemotron 3 Super est un modèle hybride mixture-of-experts construit sur l'architecture Mamba-Transformer. Il est spécifiquement conçu pour les tâches complexes avec de longs horizons de raisonnement et les scénarios où plusieurs agents interagissent au sein d'un seul flux de travail.

Caractéristiques clés du modèle :

120B paramètres au total — avec seulement 12B actifs par token, réduisant considérablement la surcharge informatique
Fenêtre de contexte de 1 million de tokens pour les tâches de raisonnement à long horizon
Optimisation pour l'opération multi-agents parallèle — même sur une seule GPU
Applications : développement de logiciels, analyse financière, automatisation de la cybersécurité

Le modèle est disponible via Dedicated Model Inference de Together AI. Les développeurs obtiennent un moyen simple et évolutif d'exécuter des modèles de raisonnement avancé en production sans construire une infrastructure personnalisée à partir de zéro.

IA vocale : Parakeet pour la transcription en temps réel

Une annonce distincte a été l'arrivée de NVIDIA Parakeet TDT 0.6B V3 dans la bibliothèque de modèles de Together AI. Il s'agit d'un modèle ASR (reconnaissance automatique de la parole) à faible latence optimisé pour les applications en temps réel. Parakeet apporte une haute précision de transcription combinée avec les performances requises par les agents conversationnels IA. Combiné à l'infrastructure d'inférence haute performance de Together, les développeurs obtiennent une pile prête à l'emploi pour construire des agents vocaux — de la transcription précise à la gestion évolutive des requêtes. Les applications potentielles englobent les interfaces vocales dans le support client, la santé, l'éducation et les communications d'entreprise, où la vitesse et la fiabilité de la reconnaissance sont critiques.

«

Les systèmes d'IA deviennent plus ouverts, agentifs et prêts pour la production » — Together AI sur le thème principal de GTC 2026.

À la conférence, l'équipe de Together AI a également animé des sessions techniques avec des clients — notamment Cursor (un assistant IA pour développeurs) et Decagon (automatisation du support client) — démontrant les applications réelles de la plateforme dans le développement de logiciels et l'automatisation des processus métier.

Ce que cela signifie

Together AI renforce constamment sa position en tant que « AI Native Cloud » — une plateforme unifiée où les modèles ouverts, l'infrastructure agentive et l'IA vocale sont disponibles pour les développeurs depuis un seul point. L'intégration étroite avec l'écosystème NVIDIA via Dynamo, NemoClaw et Parakeet fait de Together une véritable alternative aux solutions fermées pour les équipes qui valorisent la flexibilité de l'infrastructure, les coûts prévisibles et le contrôle total sur les modèles utilisés.

Hamidun News

Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Canal Telegram RSS hamidun.com

Besoin d'une IA qui travaille dans votre entreprise — pas seulement dans votre fil d'actualité?

Je construis de l'IA en production pour les entreprises — CRM sur mesure, outils internes, agents autonomes, automatisation des processus. Vous en êtes propriétaire, adaptée à votre processus, sans coût par utilisateur. Réalisé par Zhemal Khamidun, CPO d'AlpinaGPT (plateforme IA, 6 000+ utilisateurs).

Réserver une consultation gratuite →