Bloomberg Tech→ оригинал

Дефицит памяти стал главным узким местом в AI-инфраструктуре — Huang

На конференции Dell World в Лас-Вегасе CEO Nvidia Jensen Huang заявил, что дефицит высокоскоростной памяти (HBM) — самое критичное узкое место в цепи поставок д

Дефицит памяти стал главным узким местом в AI-инфраструктуре — Huang
Источник: Bloomberg Tech. Коллаж: Hamidun News.
◐ Слушать статью

На конференции Dell World в Лас-Вегасе генеральный директор Nvidia Jensen Huang затронул критичную для всей AI-индустрии проблему: дефицит высокоскоростной памяти. В беседе с CEO Dell Michael Dell и журналистом Bloomberg Ed Ludlow Huang прямо сказал, что нехватка памяти оказалась острее, чем сами узкие места в производстве чипов. Это откровенное признание того, что темп развёртывания AI-инфраструктуры замедляется не из-за недостатка самих GPU, а из-за неспособности производить нужное количество памяти.

Почему память стала дефицитом

Высокоскоростная память HBM (High Bandwidth Memory) — это специальный тип памяти, встроенный непосредственно в ускоритель. Она хранит параметры нейронных сетей и промежуточные вычисления, позволяя GPU работать на полной скорости без задержек обращения к медленной системной памяти. H100 и H200 от Nvidia имеют от 80 до 141 гигабайта такой памяти. Проблема в том, что спрос на HBM растёт экспоненциально, а производство даже не поспевает за линейным ростом. Год назад крупные компании заказывали сотни GPU; сейчас речь идёт о тысячах; вскоре потребуются миллионы. Производство памяти — это многолетний технологический цикл: новые фабрики строятся пять-семь лет, технология становится всё сложнее, а конкурентов в этом сегменте очень мало.

Кого это бьёт больше всего

Основные производители памяти — южнокорейские Samsung и SK Hynix, а также американская Micron — не справляются с ростом спроса. Все три компании вкладывают десятки миллиардов в новые производственные мощности, но даже этого недостаточно: отставание уже нарастает геометрически. Это создаёт каскад проблем по всей цепи поставок: * Цены растут: GPU с достаточной памятью становятся дороже в 1.

5–2 раза на вторичном рынке Стратегическая неопределённость: компании не знают, получат ли нужное количество оборудования в нужный срок Архитектурные жертвы: приходится использовать более узкие модели, распределять вычисления между большим количеством GPU * Рыночное расслоение: те, кто раньше заключит контракты на поставки памяти, получат значительное конкурентное преимущество Даже Dell, один из крупнейших интеграторов серверов, находится в зависимости от поставок памяти. Компания не может продать больше высокопроизводительных серверов для AI, если нет GPU, а GPU остаются неполноценными без достаточного объёма памяти.

Как реагирует индустрия

Nvidia активно работает над новыми поколениями памяти — HBM3e, HBM4 уже находятся в разработке, с прогнозируемо высокой пропускной способностью и производительностью. Однако сроки разработки, квалификации и массового производства новых стандартов памяти исчисляются годами, а не месяцами. Параллельно компания и её партнёры ищут программные обходные пути: оптимизация ПО, новые архитектуры нейросетей, которые требуют меньше памяти на единицу производительности. Но и это имеет жёсткие пределы — не все модели можно урезать, не потеряв качество вывода.

Huang заявил: это не краткосрочная проблема, которую решат за месяцы.

Дефицит памяти останется серьёзным ограничивающим фактором минимум на следующие несколько лет.

Что это значит для AI-индустрии

Дефицит памяти становится новым потолком для скорости развёртывания AI-инфраструктуры. Не все компании смогут внедрять крупные языковые модели в нужном масштабе и в нужные сроки. Это создаёт явное расслоение рынка: те, кто раньше обеспечит себе доступ к памяти, будут развиваться быстрее, те, кто опоздает, отстанут. Для венчурных инвесторов и стартапов это означает, что получение нужного оборудования становится не менее критичным фактором успеха, чем идея и команда. Это напоминает эпоху кремниевых дефицитов, когда простое наличие чипов давало конкурентное преимущество.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Что вы думаете?
Загружаем комментарии…