Sugon scaleX: 10 mil aceleradores em um único sistema para redes neurais chinesas
Em um mundo onde a quantidade de GPU determina o status de superpotência, a China decidiu parar de reclamar sobre sanções e começou a construir suas próprias…
Processado por IA de 36Kr (36氪); editado por Hamidun News
Em um mundo onde a quantidade de GPU determina o status de superpotência, a China decidiu parar de reclamar sobre sanções e começou a construir suas próprias fortalezas digitais. Enquanto acompanhamos os relatórios trimestrais da NVIDIA, a Sugon anunciou que seu megacluster scaleX entrou em implantação operacional real. Não é outro teste de laboratório ou anúncio em papel, mas um supercluster de produção completo com 10.
000 aceleradores, pronto para processar terabytes de dados para treinamento das redes neurais mais ambiciosas. O projeto entra oficialmente na fase de aplicação nos maiores projetos de engenharia do país, e isso merece atenção especial. Para entender a escala do que está acontecendo, precisamos lembrar as condições em que o setor de tecnologia chinês viveu nos últimos anos.
As restrições à exportação de chips de ponta forçaram os atores locais a desaparecer na sombra ou reinventar a roda—mas com um motor a jato. Sugon, com vasta experiência em supercomputação, escolheu o segundo caminho. O projeto scaleX foi criado como resposta direta à fome selvagem por poder computacional experimentada pelos desenvolvedores de LLM chineses.
Quando você não tem acesso direto a dezenas de milhares de H100s, a única saída é aprender a unir em uma única rede eficiente o que você tem em casa.
O que significa a figura de 10.000 aceleradores em uma rede? Para o desinformado, é apenas um grande monte de servidores, mas para um engenheiro—é um pesadelo puro de logística.
O principal problema com tais sistemas é a interconexão—a velocidade com que os cartões se comunicam. Se os dados ficarem "presos" em gargalos de pontes de rede, todo o poder computacional se torna um aquecedor caro de sala de servidores. Sugon afirma que sua arquitetura scaleX resolve o problema de escalabilidade, permitindo que milhares de chips trabalhem como um único organismo.
Isto é criticamente importante para modelos de nível GPT-4, onde o treinamento requer sincronização de volumes colossal de parâmetros em tempo real sem atrasos. A transição para a fase de "aplicação" (implantação em grandes projetos de engenharia) significa que as doenças infantis do sistema foram curadas, e o cluster é entregue aos clientes reais. Os primeiros usuários provavelmente serão estruturas governamentais e gigantes de tecnologia como Baidu ou Alibaba, que precisam treinar seus modelos em ambientes de circuito fechado.
É importante entender que a China não está apenas construindo "hardware", mas um ecossistema completamente fechado. Seus próprios aceleradores, seu próprio software, suas próprias bibliotecas de otimização e seus próprios dados. Isso torna sua indústria de IA praticamente imune a tempestades políticas externas e novos pacotes de restrições.
É claro que céticos perguntarão imediatamente sobre eficiência. É uma coisa montar 10.000 cartões em um edifício, e outra bem diferente fazê-los funcionar com a mesma eficiência que clusters baseados em infraestrutura NVIDIA.
No entanto, o mero fato de um sistema funcionando dessa escala sugere que o fosso tecnológico que analistas ocidentais adoram discutir pode ser mais curto do que parece. Se scaleX mostrar resultados decentes nos próximos meses, isso será um sinal poderoso para todo o mercado: o monopólio sobre "big compute" está oficialmente sob ameaça.
No futuro próximo, veremos os primeiros frutos desta máquina. Provavelmente serão não apenas chatbots para gerar poesia, mas modelos especializados específicos da indústria para indústria pesada, previsão do tempo e medicina profunda. A China tradicionalmente aposta na aplicação prática de IA na economia real, onde o poder computacional se converte em dinheiro real e vantagens competitivas no palco global. Enquanto o resto do mundo discute ética, Sugon está simplesmente construindo o fundamento para dominação digital.
O ponto chave: Sugon scaleX não é apenas uma fazenda de servidores, mas uma reivindicação legítima de soberania computacional. Se um cluster de 10.000 cartões operar em plena capacidade e demonstrar estabilidade, a dependência da China de hardware ocidental se torna notícia de ontem. Este "gigante chinês" conseguirá superar limitações de desempenho de chips individuais através de uma arquitetura impecável de toda a rede? Obteremos a resposta nos testes vindouros.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.