GPU-облако (неооблако)
GPU-облако (неооблако) — специализированный облачный провайдер, предоставляющий высокопроизводительные GPU-кластеры в аренду преимущественно для задач обучения и инференса ИИ-моделей, в отличие от гиперскейлеров с широким набором общих инфраструктурных сервисов.
GPU-облака возникли как ответ на взрывной спрос на вычислительные ресурсы для ИИ при дефиците мощностей у традиционных облачных провайдеров. Неооблако (neocloud) — неформальное обозначение волны таких компаний, фокусирующихся исключительно или преимущественно на GPU-инфраструктуре и не конкурирующих с гиперскейлерами на полях баз данных, CDN, SaaS и корпоративных платформенных сервисов.
Бизнес-модель GPU-облак строится на арбитраже между оптовыми закупками чипов NVIDIA (H100, H200, Blackwell GB200) и розничной арендой кластеров по почасовой или долгосрочной резервированной схеме. Ключевые игроки — CoreWeave (крупнейший независимый, вышедший на IPO на Nasdaq в марте 2025 года после привлечения свыше $11 млрд инвестиций), Lambda Labs, Vast.ai, RunPod, Crusoe. Ряд провайдеров специализируется на нишах: дешёвый спот-инференс, кластеры с низкой задержкой для академических исследований или дата-центры с низким углеродным следом.
GPU-облака решают несколько рыночных проблем: в период пика спроса гиперскейлеры имели листы ожидания на H100-мощности, их ценообразование не всегда конкурентоспособно для чисто GPU-нагрузок, а громоздкость enterprise-контрактов отпугивает стартапы. Неооблака предлагают более гибкий доступ, специализированный networking (InfiniBand, RoCE), оптимизированный под распределённое обучение, и прямую техническую поддержку для ИИ-инженеров.
К 2026 году рынок GPU-облак консолидируется: крупные неооблака провели IPO или привлекли стратегических инвесторов, NVIDIA поддерживает партнёрских провайдеров через программу NCP (NVIDIA Cloud Partners). Параллельно гиперскейлеры агрессивно наращивают собственные GPU-мощности и снижают цены, что сужает арбитражную маржу независимых провайдеров.