Бизнес

Компьют (вычислительные мощности)

Компьют (compute) в контексте ИИ — совокупность вычислительных ресурсов (GPU, TPU, память, сетевая пропускная способность), необходимых для обучения и работы ИИ-моделей. Объём доступного компьюта стал ключевым ограничением и стратегическим активом в разработке frontier-моделей.

Компьют (compute) — обобщённое название вычислительных ресурсов, задействованных в обучении, доводке (fine-tuning) и инференсе ИИ-моделей. В прикладном смысле это GPU- и TPU-кластеры, время их работы, доступная память, скорость межузловой коммуникации (interconnect) и, опосредованно, электропотребление. Объём компьюта обычно измеряют в FLOPS или в стоимости аренды соответствующих мощностей, а бюджет обучения фиксируют в FLOP (без «S») как абсолютной величине потреблённых операций.

Масштаб компьюта напрямую связан с качеством модели: законы масштабирования (scaling laws), описанные командой OpenAI в 2020 году (Kaplan et al.), показали, что при одновременном увеличении компьюта, объёма данных и числа параметров качество модели улучшается предсказуемо — по степенному закону. Это сделало гонку за компьют центральной стратегией отрасли. Обучение GPT-4, по неофициальным оценкам, потребовало десятки тысяч GPU-часов класса H100 и обошлось в десятки миллионов долларов.

Компьют стал предметом геополитической конкуренции. США ввели экспортные ограничения на передовые ускорители (Nvidia H100, H200, B200) для Китая и ряда других стран; Китай ответил ускорением собственной полупроводниковой программы (Huawei Ascend). Крупнейшие облачные провайдеры — Microsoft Azure, Google Cloud, Amazon AWS — строят специализированные ИИ-кластеры мощностью в сотни мегаватт. Доступ к достаточному компьюту фактически определяет, какие организации способны обучать frontier-модели.

К 2026 году потребление компьюта продолжает расти опережающими темпами: обучение следующего поколения моделей требует на порядок больше ресурсов, чем предыдущего. Это приводит к дефициту GPU, росту цен на электроэнергию в дата-центрах и масштабному строительству новых объектов в США, Европе и Юго-Восточной Азии. Параллельно исследователи работают над повышением эффективности: дистилляция моделей, архитектура смеси экспертов (MoE) и аппаратные оптимизации позволяют достигать сопоставимого качества при меньшем компьюте.

Пример

Компания планирует обучение специализированной языковой модели на медицинских данных и арендует кластер из 512 GPU H100 на облачной платформе на 30 дней — суммарный вычислительный бюджет операции составляет порядка 10²³–10²⁴ FLOP.

Связанные термины

Последние новости по теме

← Глоссарий