MarkTechPost→ original

NVIDIA a présenté Nemotron 3 Super — un modèle ouvert de 120 milliards de paramètres

L'entreprise de Santa Clara a lancé Nemotron 3 Super, un modèle de langage ouvert de 120 milliards de paramètres, conçu spécialement pour des applications…

Traité par IA depuis MarkTechPost ; édité par Hamidun News
NVIDIA a présenté Nemotron 3 Super — un modèle ouvert de 120 milliards de paramètres
Source : MarkTechPost. Collage: Hamidun News.
◐ Écouter l'article

NVIDIA a Présenté Nemotron 3 Super — Un Modèle Ouvert avec 120 Milliards de Paramètres

L'écart entre les systèmes commerciaux fermés et les modèles de langage ouverts se réduit à un rythme qui aurait semblé impossible il y a seulement quelques années. NVIDIA, une entreprise dont le nom est devenu depuis longtemps synonyme de supériorité matérielle à l'ère de l'intelligence artificielle, franchit également des pas de plus en plus confiants dans l'espace logiciel. Sa nouvelle version — Nemotron 3 Super avec 120 milliards de paramètres — prétend non seulement à une place dans le tableau des leaders, mais à une redéfinition de la logique même de construction des modèles ouverts pour les tâches d'agent.

Pour comprendre l'importance de cette version, il faut examiner le contexte. Au cours des deux dernières années, les modèles ouverts se sont développés rapidement, mais ils ont toujours été à la traîne par rapport aux homologues fermés dans plusieurs caractéristiques clés : les performances sur les tâches complexes multi-étapes, la vitesse d'inférence et la capacité à fonctionner efficacement dans des scénarios multi-agents. GPT-4, Claude et Gemini ont longtemps maintenu un avantage qualité précisément dans ces domaines. Nemotron 3 Super a été créé comme réponse à cet écart — non pas un compromis entre ouverture et qualité, mais une tentative d'éliminer la nécessité même d'un tel compromis.

La solution technique sous-jacente au modèle mérite une attention particulière. NVIDIA a appliqué une architecture hybride dans laquelle le mécanisme Mamba — une alternative efficace au Transformer classique lorsque l'on travaille avec de longues séquences — est combiné avec le mécanisme Attention traditionnel. Superposée à cela se trouve l'approche Mixture-of-Experts, qui permet d'activer seulement une partie des paramètres à chaque appel au modèle.

Le résultat est une augmentation cinq fois du débit par rapport aux analogues architecturaux de la même classe de poids. Ce n'est pas une métrique marketing : dans les systèmes d'agents réels, où le modèle traite des dizaines de demandes parallèles et gère des chaînes d'outils, la vitesse d'inférence devient souvent le goulot d'étranglement de tout le système.

Dans la gamme de produits NVIDIA, Nemotron 3 Super occupe une position intermédiaire bien réfléchie. La version compacte avec 30 milliards de paramètres vise le déploiement avec des ressources limitées et des applications locales. Les solutions plus grandes sont destinées aux tâches nécessitant une profondeur de raisonnement maximale. Nemotron 3 Super comble l'espace entre eux : suffisamment puissant pour les scénarios corporatifs complexes, suffisamment efficace pour ne pas nécessiter des dépenses d'infrastructure gigantesques. Ce positionnement suggère que NVIDIA conçoit non pas un produit distinct, mais un écosystème dans lequel chaque composant résout sa propre tâche sans redondance.

Les conséquences de cette version vont bien au-delà de la discussion technique. Premièrement, elle augmente la pression sur OpenAI, Anthropic et Google dans le segment des clients corporatifs. Les entreprises qui ont précédemment choisi les API fermées pour des raisons de qualité ont maintenant un argument pour passer aux solutions ouvertes : contrôle total des données, capacité à affiner et absence de dépendance vis-à-vis d'un fournisseur externe. Pour les industries sensibles à la confidentialité — finance, santé, secteur gouvernemental — cela pourrait être un facteur décisif dans le choix de l'infrastructure.

Tout aussi important est le signal que Nemotron 3 Super envoie à la communauté de recherche. Les poids ouverts signifient la possibilité de reproduction, d'audit et d'amélioration — quelque chose dont les modèles fermés sont fondamentalement dépourvus. Si l'architecture hybride Mamba-Attention offre réellement les gains d'efficacité revendiqués, elle pourrait devenir une nouvelle norme pour la prochaine génération de systèmes ouverts. NVIDIA publie essentiellement non seulement un modèle, mais un point de référence architectural.

La version de Nemotron 3 Super marque un moment où l'IA ouverte cesse d'être synonyme de « suffisamment bon » et commence à prétendre au rôle de meilleur de sa catégorie. NVIDIA convertit habilement sa domination dans l'espace matériel en autorité logicielle, formant une pile complète — des puces aux poids du modèle. Pour le marché, cela signifie une concurrence intensifiée et, par conséquent, un progrès accéléré. Pour les développeurs — un choix réel élargi. Et pour toute l'industrie — la confirmation que la course la plus passionnante en intelligence artificielle se déroule aujourd'hui non pas derrière les portes fermées des laboratoires, mais en accès ouvert.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…