Together AI en NVIDIA GTC 2026: Dynamo, modelos multiagente y AI de voz

Together AI realizó cuatro anuncios importantes en NVIDIA GTC 2026. La empresa integró NVIDIA Dynamo 1.0 en su stack de inferencia y, junto con NVIDIA, lanzó…

Redacción de Hamidun News

Monitoreo de AI · Together AI Blog

30 jun 2026· 2 min

Procesado por IA desde Together AI Blog; editado por Hamidun News

Together AI en NVIDIA GTC 2026: Dynamo, modelos multiagente y AI de voz — Fuente: Together AI Blog. Collage: Hamidun News.

◐ Escuchar artículo

Together AI apareció en NVIDIA GTC 2026 en San Jose con cuatro grandes anuncios — desde un nuevo motor de inferencia hasta IA de voz y un potente modelo para flujos de trabajo multiagente. El tema principal de la conferencia se alinea con la dirección estratégica de la empresa: los sistemas de IA se están volviendo más abiertos, agentivos y listos para la implementación industrial. Para desarrolladores y equipos de IA, esto significa un nuevo nivel de accesibilidad a herramientas que anteriormente requerían recursos significativos.

Dynamo 1.0 e infraestructura agentiva

NVIDIA lanzó Dynamo 1.0 — un motor de software de código abierto para inferencia generativa y agentiva a escala de producción. Together AI ya ha integrado Dynamo en su stack de inferencia y lo aplica activamente para optimizar cargas de trabajo del mundo real.

Según la empresa, esto permite lograr mayor rendimiento al procesar solicitudes pesadas con costos más bajos. En paralelo, NVIDIA y Together AI lanzaron conjuntamente NVIDIA NemoClaw — un stack de código abierto que simplifica la implementación de asistentes de IA con conexiones persistentes. En una única implementación, configura NVIDIA OpenShell — un entorno seguro para ejecutar agentes autónomos — y proporciona acceso a modelos abiertos, incluido NVIDIA Nemotron.

Para desarrolladores que construyen sistemas agentivos, esto significa acceso direto a la biblioteca de Together con 150+ modelos optimizados con endpoints dedicados escalados para cargas de trabajo de producción. La combinación de NemoClaw e infraestructura dedicada de Together reduce la barrera de entrada para equipos que desean lanzar productos de IA agentivos sin configuración prolongada.

Nemotron 3 Super: razonamiento complejo y tareas multiagente

NVIDIA Nemotron 3 Super es un modelo híbrido mixture-of-experts construido en la arquitectura Mamba-Transformer. Está específicamente diseñado para tareas complejas con horizontes de razonamiento largos y escenarios donde múltiples agentes interactúan dentro de un único flujo de trabajo.

Características clave del modelo:

120B parámetros en total — con solo 12B activos por token, reduciendo significativamente la sobrecarga computacional
Ventana de contexto de 1 millón de tokens para tareas de razonamiento de largo horizonte
Optimización para operación multiagente paralela — incluso en una única GPU
Aplicaciones: desarrollo de software, análisis financiero, automatización de ciberseguridad

El modelo está disponible a través de Dedicated Model Inference de Together AI. Los desarrolladores obtienen una forma simple y escalable de ejecutar modelos de razonamiento avanzado en producción sin construir infraestructura personalizada desde cero.

IA de voz: Parakeet para transcripción en tiempo real

Un anuncio separado fue la llegada de NVIDIA Parakeet TDT 0.6B V3 a la biblioteca de modelos de Together AI. Este es un modelo ASR (reconocimiento automático de voz) de baja latencia optimizado para aplicaciones en tiempo real. Parakeet proporciona alta precisión de transcripción combinada con el rendimiento requerido por agentes conversacionales de IA. Combinado con la infraestructura de inferencia de alto rendimiento de Together, los desarrolladores obtienen un stack listo para construir agentes de voz — desde transcripción precisa hasta manejo escalable de solicitudes. Las aplicaciones potenciales abarcan interfaces de voz en atención al cliente, sanidad, educación y comunicaciones corporativas, donde la velocidad y confiabilidad del reconocimiento son críticas.

"Los sistemas de IA se están volviendo más abiertos, agentivos y listos para producción" —

Together AI sobre el tema principal de GTC 2026.

En la conferencia, el equipo de Together AI también realizó sesiones técnicas con clientes — incluidos Cursor (un asistente de IA para desarrolladores) y Decagon (automatización de atención al cliente) — demostrando aplicaciones prácticas de la plataforma en desarrollo de software y automatización de procesos empresariales.

Qué significa esto

Together AI está fortaleciendo consistentemente su posición como "AI Native Cloud" — una plataforma unificada donde modelos abiertos, infraestructura agentiva e IA de voz están disponibles para desarrolladores desde un único punto. La integración estrecha con el ecosistema NVIDIA a través de Dynamo, NemoClaw y Parakeet convierte Together en una verdadera alternativa a soluciones cerradas para equipos que valoran la flexibilidad de la infraestructura, costos predecibles y control total sobre los modelos utilizados.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Necesitas IA funcionando dentro de tu empresa — no solo en tu feed de noticias?

Construyo IA en producción para empresas — CRM a medida, herramientas internas, agentes autónomos, automatización de procesos. Tuya, adaptada a tu proceso, sin coste por usuario. Creado por Zhemal Khamidun, CPO de AlpinaGPT (plataforma de IA, 6.000+ usuarios).

Reservar consulta gratuita →