Sugon scaleX : 10 000 accélérateurs en un seul attelage pour les réseaux neuronaux chinois
Dans un monde où la quantité de GPU détermine le statut de superpuissance, la Chine a décidé d'arrêter de se plaindre des sanctions et a commencé à…
Traité par IA depuis 36Kr (36氪) ; édité par Hamidun News
Dans un monde où la quantité de GPU détermine le statut de superpuissance, la Chine a décidé d'arrêter de se plaindre des sanctions et a commencé à construire ses propres forteresses numériques. Alors que nous suivons les rapports trimestriels de NVIDIA, Sugon a annoncé que son mégacluster scaleX est entré en phase de déploiement opérationnel réel. Ce n'est pas un autre test de laboratoire ni une annonce sur papier, mais un supercluster de production à part entière avec 10 000 accélérateurs, prêt à traiter des téraoctets de données pour l'entraînement des réseaux de neurones les plus ambitieux.
Le projet entre officiellement en phase d'application dans les plus grands projets d'ingénierie du pays, et cela mérite une attention particulière. Pour comprendre l'ampleur de ce qui se passe, nous devons nous souvenir des conditions dans lesquelles le secteur technologique chinois a vécu ces dernières années. Les restrictions à l'exportation de puces de pointe ont forcé les acteurs locaux soit à se cacher dans l'ombre, soit à réinventer la roue—mais avec un moteur à réaction.
Sugon, forte d'une vaste expérience en supercalcul, a choisi la deuxième voie. Le projet scaleX a été créé en réponse directe à la faim effrénée de puissance de calcul qu'éprouvent les développeurs de LLM chinois. Quand on n'a pas accès direct à des dizaines de milliers de H100, la seule issue est d'apprendre à unir en un seul réseau efficace ce qu'on a à disposition.
Que signifie le chiffre de 10 000 accélérateurs sur un seul réseau ? Pour le profane, c'est simplement un grand tas de serveurs, mais pour un ingénieur—c'est un cauchemar pur du point de vue logistique. Le problème principal de tels systèmes est l'interconnexion—la vitesse à laquelle les cartes communiquent entre elles.
Si les données se « coincent » dans les goulets d'étranglement des ponts réseau, toute la puissance de calcul devient un coûteux radiateur de salle serveur. Sugon prétend que son architecture scaleX résout le problème de scalabilité, permettant à des milliers de puces de fonctionner comme un seul organisme. C'est critique pour les modèles de niveau GPT-4, où l'entraînement nécessite de synchroniser des volumes colossaux de paramètres en temps réel sans délai.
La transition vers la phase « d'application » (déploiement dans les grands projets d'ingénierie) signifie que les maladies infantiles du système ont été guéries, et le cluster est livré à de vrais clients. Les premiers utilisateurs seront probablement des structures gouvernementales et des géants technologiques comme Baidu ou Alibaba, qui ont besoin d'entraîner leurs modèles en environnement en circuit fermé.
Il est important de comprendre que la Chine ne construit pas simplement du « matériel », mais un écosystème complètement fermé. Ses propres accélérateurs, ses propres logiciels, ses propres bibliothèques d'optimisation et ses propres données. Cela rend son industrie de l'IA pratiquement imperméable aux tempêtes politiques externes et aux nouveaux paquets de restrictions.
Bien sûr, les sceptiques demanderont immédiatement l'efficacité. C'est une chose d'assembler 10 000 cartes dans un bâtiment, et c'en est une autre de les faire fonctionner avec la même efficacité que les clusters basés sur l'infrastructure NVIDIA. Cependant, le simple fait de l'existence d'un système fonctionnant à cette échelle suggère que le fossé technologique que les analystes occidentaux adorent discuter pourrait être plus court qu'il ne le paraît.
Si scaleX montre des résultats décents dans les prochains mois, ce sera un signal puissant pour tout le marché : le monopole sur le « gros calcul » est officiellement menacé.
Dans un proche avenir, nous verrons les premiers fruits de cette machine. Ce seront probablement non pas simplement des chatbots pour générer de la poésie, mais des modèles spécialisés spécifiques à l'industrie pour l'industrie lourde, la prévision météorologique et la médecine profonde. La Chine mise traditionnellement sur l'application pratique de l'IA dans l'économie réelle, où la puissance de calcul se convertit en argent réel et en avantages compétitifs sur la scène mondiale. Tandis que le reste du monde discute d'éthique, Sugon construit simplement les fondations pour la domination numérique.
Le point clé : Sugon scaleX n'est pas simplement une ferme de serveurs, mais une revendication légitime de souveraineté informatique. Si un cluster de 10 000 cartes fonctionne à pleine capacité et démontre la stabilité, la dépendance de la Chine au matériel occidental devient une nouvelle d'hier. Ce « géant chinois » pourra-t-il surmonter les limitations de performance des puces individuelles grâce à une architecture impeccable de tout le réseau ? Nous obtiendrons la réponse lors des prochains essais.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.