NVIDIA presentó Nemotron 3 Super — un modelo abierto con 120 mil millones de parámetros
La empresa de Santa Clara lanzó Nemotron 3 Super, un modelo de lenguaje abierto con 120 mil millones de parámetros, creado específicamente para aplicaciones…
Procesado por IA desde MarkTechPost; editado por Hamidun News
NVIDIA Presentó Nemotron 3 Super — Un Modelo Abierto con 120 Mil Millones de Parámetros
La brecha entre sistemas comerciales cerrados y modelos de lenguaje abiertos se está estrechando a un ritmo que habría parecido imposible hace apenas unos años. NVIDIA, una empresa cuyo nombre se ha convertido durante mucho tiempo en sinónimo de superioridad del hardware en la era de la inteligencia artificial, está dando pasos cada vez más seguros también en el espacio del software. Su nuevo lanzamiento — Nemotron 3 Super con 120 mil millones de parámetros — pretende no solo un lugar en la tabla de líderes, sino una redefinición de la lógica misma de construcción de modelos abiertos para tareas de agente.
Para entender el significado de este lanzamiento, es necesario mirar el contexto. Durante los últimos dos años, los modelos abiertos se han desarrollado rápidamente, pero siempre han quedado rezagados con respecto a los equivalentes cerrados en varias características clave: rendimiento en tareas complejas de múltiples pasos, velocidad de inferencia y la capacidad de trabajar eficientemente en escenarios multiagente. GPT-4, Claude y Gemini mantuvieron una ventaja de calidad durante mucho tiempo precisamente en estas áreas. Nemotron 3 Super se creó como respuesta a esta brecha — no un compromiso entre apertura y calidad, sino un intento de eliminar la propia necesidad de tal compromiso.
La solución técnica subyacente al modelo merece atención especial. NVIDIA aplicó una arquitectura híbrida en la que el mecanismo Mamba — una alternativa eficiente al Transformer clásico al trabajar con secuencias largas — se combina con el mecanismo Attention tradicional. Superpuesto a esto está el enfoque Mixture-of-Experts, que permite activar solo parte de los parámetros con cada llamada al modelo.
El resultado es un aumento cinco veces en el rendimiento en comparación con análogos arquitectónicos de la misma clase de peso. Esta no es una métrica de marketing: en sistemas de agente reales, donde el modelo procesa docenas de solicitudes paralelas y administra cadenas de herramientas, la velocidad de inferencia a menudo se convierte en el cuello de botella de todo el sistema.
En la línea de productos NVIDIA, Nemotron 3 Super ocupa una posición intermedia bien considerada. La versión compacta con 30 mil millones de parámetros está orientada al despliegue con recursos limitados y aplicaciones locales. Las soluciones más grandes son para tareas que requieren máxima profundidad de razonamiento. Nemotron 3 Super cubre el espacio entre ellas: lo suficientemente potente para escenarios corporativos complejos, lo suficientemente eficiente para no requerir gastos de infraestructura gigantescos. Este posicionamiento sugiere que NVIDIA está diseñando no un producto separado, sino un ecosistema en el que cada componente resuelve su propia tarea sin redundancia.
Las consecuencias de este lanzamiento van mucho más allá de la discusión técnica. En primer lugar, aumenta la presión sobre OpenAI, Anthropic y Google en el segmento de clientes corporativos. Las empresas que anteriormente elegían API cerradas por razones de calidad ahora tienen un argumento para cambiar a soluciones abiertas: control total de datos, capacidad de ajuste fino y ausencia de dependencia de un proveedor externo. Para industrias sensibles a la privacidad — finanzas, salud, sector gubernamental — esto podría ser un factor decisivo al elegir la infraestructura.
Igualmente importante es la señal que Nemotron 3 Super envía a la comunidad investigadora. Los pesos abiertos significan la posibilidad de reproducción, auditoría y mejora — algo de lo que los modelos cerrados están fundamentalmente privados. Si la arquitectura híbrida Mamba-Attention realmente entrega las ganancias de eficiencia afirmadas, podría convertirse en un nuevo estándar para la próxima generación de sistemas abiertos. NVIDIA está esencialmente publicando no solo un modelo, sino un punto de referencia arquitectónico.
El lanzamiento de Nemotron 3 Super marca un momento en el que la IA abierta deja de ser sinónimo de "suficientemente bueno" y comienza a reclamar el papel de mejor en su clase. NVIDIA convierte hábilmente su dominio en el espacio del hardware en autoridad de software, formando un stack completo — desde chips hasta pesos de modelo. Para el mercado, esto significa competencia intensificada y, como resultado, progreso acelerado. Para desarrolladores — opciones reales expandidas. Y para toda la industria — confirmación de que la carrera más emocionante en inteligencia artificial hoy se está desarrollando no detrás de puertas cerradas de laboratorios, sino en acceso abierto.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.