36Kr (36氪)→ original

Sugon scaleX: 10 000 aceleradores en un solo conjunto para redes neuronales chinas

En un mundo donde la cantidad de GPU determina el estatus de superpotencia, China decidió dejar de quejarse sobre sanciones y comenzó a construir sus propias…

Procesado por IA desde 36Kr (36氪); editado por Hamidun News
Sugon scaleX: 10 000 aceleradores en un solo conjunto para redes neuronales chinas
Fuente: 36Kr (36氪). Collage: Hamidun News.
◐ Escuchar artículo

En un mundo donde la cantidad de GPU determina el estatus de superpotencia, China decidió dejar de quejarse sobre sanciones y comenzó a construir sus propias fortalezas digitales. Mientras seguimos los informes trimestrales de NVIDIA, Sugon anunció que su megaclúster scaleX ha entrado en fase de despliegue operacional real. No es otra prueba de laboratorio ni un anuncio en papel, sino un superclúster de producción completo con 10.

000 aceleradores, listo para procesar terabytes de datos para entrenar las redes neuronales más ambiciosas. El proyecto entra oficialmente en fase de aplicación en los mayores proyectos de ingeniería del país, y esto merece atención especial. Para entender la escala de lo que está sucediendo, necesitamos recordar las condiciones en que el sector tecnológico chino ha vivido en los últimos años.

Las restricciones a la exportación de chips avanzados obligaron a los actores locales a esconderse en las sombras o a reinventar la rueda—pero con un motor a reacción. Sugon, con amplia experiencia en supercomputación, eligió el segundo camino. El proyecto scaleX fue creado como respuesta directa al hambre desenfrenada de potencia computacional que experimentan los desarrolladores de LLM chinos.

Cuando no tienes acceso directo a decenas de miles de H100, la única salida es aprender a unir en una única red eficiente lo que tienes en casa.

¿Qué significa la cifra de 10.000 aceleradores en una sola red? Para el profano, es simplemente un gran montón de servidores, pero para un ingeniero—es una pesadilla pura de logística.

El problema principal de tales sistemas es la interconexión—la velocidad a la que las tarjetas se comunican entre sí. Si los datos se "quedan atrapados" en cuellos de botella de puentes de red, toda la potencia computacional se convierte en un costoso calentador de salas de servidores. Sugon afirma que su arquitectura scaleX resuelve el problema de escalabilidad, permitiendo que miles de chips trabajen como un único organismo.

Esto es crítico para modelos de nivel GPT-4, donde el entrenamiento requiere sincronizar volúmenes colosales de parámetros en tiempo real sin retrasos. La transición a fase de "aplicación" (despliegue en grandes proyectos de ingeniería) significa que las enfermedades infantiles del sistema han sido curadas, y el clúster se entrega a clientes reales. Los primeros usuarios serán probablemente estructuras gubernamentales y gigantes tecnológicos como Baidu o Alibaba, que necesitan entrenar sus modelos en entornos de circuito cerrado.

Es importante entender que China no está construyendo solo "hardware", sino un ecosistema completamente cerrado. Sus propios aceleradores, su propio software, sus propias bibliotecas de optimización y sus propios datos. Esto hace que su industria de IA sea prácticamente invulnerable a tormentas políticas externas y nuevos paquetes de restricciones.

Por supuesto, los escépticos preguntarán inmediatamente sobre eficiencia. Es una cosa ensamblar 10.000 tarjetas en un edificio, y otra muy distinta hacerlas funcionar con la misma eficiencia que clústeres basados en infraestructura NVIDIA.

Sin embargo, el mero hecho de que exista un sistema funcional de tal escala sugiere que la brecha tecnológica que los analistas occidentales aman discutir podría ser más corta de lo que parece. Si scaleX muestra resultados decentes en los próximos meses, esto será una señal poderosa para todo el mercado: el monopolio sobre "big compute" está oficialmente bajo amenaza.

En el futuro próximo, veremos los primeros frutos de esta máquina. Probablemente no serán solo chatbots para generar poesía, sino modelos especializados específicos de la industria para industria pesada, predicción meteorológica y medicina profunda. China apuesta tradicionalmente por la aplicación práctica de IA en la economía real, donde la potencia computacional se convierte en dinero real y ventajas competitivas en el escenario global. Mientras el resto del mundo discute ética, Sugon simplemente está construyendo el fundamento para la dominación digital.

Lo clave: Sugon scaleX no es solo una granja de servidores, sino una reivindicación legítima de soberanía computacional. Si un clúster de 10.000 tarjetas funciona a plena capacidad y demuestra estabilidad, la dependencia de China del hardware occidental se convierte en noticia de ayer. ¿Podrá este "gigante chino" superar las limitaciones de rendimiento de chips individuales a través de una arquitectura impecable de toda la red? Obtendremos la respuesta en las próximas pruebas.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…