Железо

ИИ-ускоритель

ИИ-ускоритель — аппаратное устройство, спроектированное для ускорения задач машинного обучения: обучения и инференса нейронных сетей. Термин объединяет GPU, TPU, NPU и специализированные ASIC, оптимизированные под матричные вычисления и параллельную обработку данных.

ИИ-ускоритель — собирательное название для широкого класса аппаратных устройств, архитектурно оптимизированных под операции машинного обучения: умножение матриц, свёртки и вычисление механизма внимания (attention). В эту категорию входят GPU (NVIDIA H100, AMD MI300X), тензорные процессоры (Google TPU), специализированные чипы (Cerebras WSE-3, Groq LPU), а также NPU в потребительских устройствах. Объединяющий признак — способность выполнять миллиарды однотипных операций с плавающей точкой или целыми числами значительно эффективнее, чем CPU общего назначения.

Все ИИ-ускорители обеспечивают массивный параллелизм: вместо нескольких мощных ядер они содержат тысячи или десятки тысяч упрощённых вычислительных единиц, одновременно обрабатывающих элементы тензоров. Критическими параметрами служат пиковая производительность (TFLOPS/TOPS), пропускная способность памяти (HBM3/HBM3e) и скорость межчиповых соединений (NVLink, InfiniBand, оптические интерконнекты). NVIDIA H100 SXM5 достигает до 3,9 PFLOPS для формата FP8 и оснащён 80 ГБ HBM3; Cerebras WSE-3 размещает 4 трлн транзисторов и 900 000 AI-ядер на одном монолитном кристалле площадью 46 225 мм², устраняя узкие места пропускной способности HBM.

Рынок ИИ-ускорителей стал одним из наиболее быстро растущих сегментов полупроводниковой отрасли. Дефицит GPU для обучения крупных языковых моделей в 2023–2024 годах повлёк за собой сотни миллиардов долларов капитальных вложений в производственные мощности TSMC, Samsung Foundry и планируемые заводы Intel Foundry. Доступность ускорителей напрямую определяет темп продвижения к фронтиру возможностей моделей и стоимость запроса при промышленном развёртывании.

К 2026 году рынок устойчиво сегментирован: дата-центровые чипы для обучения (NVIDIA Blackwell B200, AMD MI325X), специализированные инференс-ускорители (Groq LPU, Cerebras CS-3), фирменные ASIC облачных провайдеров (AWS Trainium 2, Google TPU v6, Microsoft Maia 2) и потребительские NPU в SoC. NVIDIA сохраняет лидерство благодаря зрелости экосистемы CUDA, однако совокупная доля альтернативных поставщиков устойчиво растёт.

Пример

Лаборатория обучает модель с 70 млрд параметров на кластере из 512 чипов NVIDIA H100, а для серийного инференса переводит нагрузку на специализированный ASIC с детерминированной задержкой, снижая стоимость обслуживания одного запроса почти вдвое.

Связанные термины

← Глоссарий