36Kr (36氪)→ оригинал

Sugon scaleX: 10 000 ускорителей в одной упряжке для китайских нейросетей

Пока мир обсуждает дефицит H100, китайская Sugon тихой сапой достроила свой мегакластер scaleX. Речь идет о «» — системе на 10 000 ускорителей, которая уже пере

Sugon scaleX: 10 000 ускорителей в одной упряжке для китайских нейросетей
Источник: 36Kr (36氪). Коллаж: Hamidun News.

В мире, где количество GPU определяет статус сверхдержавы, Китай решил перестать жаловаться на санкции и начал строить свои цифровые крепости. Пока мы с вами следим за очередными квартальными отчетами NVIDIA, компания Sugon объявила о переходе своего мегакластера scaleX в стадию реальной эксплуатации. Это не очередной лабораторный стенд или бумажный анонс, а полноценный «» — суперкластер на 10 000 ускорителей, готовый перемалывать терабайты данных для обучения самых амбициозных нейросетей.

Проект официально вступает в фазу применения в крупнейших инженерных проектах страны, и это событие заслуживает пристального внимания. Чтобы понять масштаб происходящего, нужно вспомнить, в каких условиях живет китайский техсектор последние пару лет. Ограничения на экспорт передовых чипов заставили локальных игроков либо уходить в тень, либо изобретать велосипед заново, но с реактивным двигателем.

Sugon, имеющая богатый опыт в суперкомпьютерных вычислениях, выбрала второй путь. Проект scaleX создавался как прямой ответ на дикий голод по вычислительным мощностям, который испытывают разработчики китайских LLM. Когда у тебя под рукой нет прямого доступа к десяткам тысяч H100, единственный выход — научиться объединять в одну эффективную сеть то, что есть у себя дома.

Что вообще означает цифра в 10 000 ускорителей в одной сети? Для непосвященного это просто большая куча серверов, но для инженера — это сущий кошмар с точки зрения логистики данных. Основная проблема таких систем заключается в интерконнекте — скорости, с которой карты общаются друг с другом.

Если данные будут «застревать» в узких местах сетевых мостов, вся вычислительная мощь превратится в дорогой обогреватель для серверной. Sugon заявляет, что их архитектура scaleX решает проблему масштабируемости, позволяя тысячам чипов работать как единый организм. Это критически важно для моделей уровня GPT-4, где обучение требует синхронизации колоссальных объемов параметров в реальном времени без задержек.

Переход к стадии «» (применение в крупных инженерных проектах) означает, что детские болезни системы вылечены, и кластер отдают на растерзание реальным заказчикам. Скорее всего, первыми пользователями станут государственные структуры и технологические гиганты вроде Baidu или Alibaba, которым нужно тренировать свои модели в закрытом контуре. Важно понимать, что Китай строит не просто «железо», а полностью замкнутую экосистему.

Свои ускорители, свой софт, свои библиотеки оптимизации и свои данные. Это делает их ИИ-индустрию практически неуязвимой к внешним политическим штормам и новым пакетам ограничений. Конечно, скептики сразу спросят про эффективность.

Одно дело — собрать 10 000 карт в одном здании, и совсем другое — заставить их работать с тем же КПД, что и кластеры на базе инфраструктуры NVIDIA. Однако сам факт существования работающей системы такого масштаба говорит о том, что технологический разрыв, о котором так любят рассуждать западные аналитики, может оказаться короче, чем кажется. Если scaleX покажет достойные результаты в ближайшие месяцы, это станет мощным сигналом для всего рынка: монополия на «большие вычисления» официально под угрозой.

В ближайшее время мы увидим первые плоды этой машины. Скорее всего, это будут не просто чат-боты для генерации стихов, а специализированные отраслевые модели для тяжелой промышленности, предсказания погоды и глубокой медицины. Китай традиционно делает ставку на практическое применение ИИ в реальном секторе экономики, где вычислительная мощь конвертируется в реальные деньги и конкурентные преимущества на мировой арене.

Пока остальной мир обсуждает этику, Sugon просто строит фундамент для цифрового доминирования. Главное: Sugon scaleX — это не просто серверная ферма, а полноценная заявка на вычислительный суверенитет. Если кластер на 10 000 карт заработает в полную силу и покажет стабильность, зависимость Китая от западного железа станет вчерашней новостью.

Сможет ли этот «китайский гигант» обойти ограничения по производительности отдельных чипов за счет безупречной архитектуры всей сети? Ответ мы получим уже в ходе ближайших испытаний.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…