3DNews AI→ оригинал

Новые GPU снизят стоимость инференса, но не цены для пользователей

Инференс (развёртывание ИИ-моделей) дорожает из-за растущей нагрузки на инфраструктуру. Новое поколение GPU и специализированных ускорителей обещает облегчить с

Новые GPU снизят стоимость инференса, но не цены для пользователей
Источник: 3DNews AI. Коллаж: Hamidun News.
◐ Слушать статью

Каждый день AI-сервисы дорожают из-за растущей нагрузки на инфраструктуру. Компании тратят все больше на серверы и графические процессоры для инференса — фазы, когда обученная модель работает и отвечает на запросы пользователей. И потребители ощущают это в счетах за API и подписки.

Почему инференс так дорогой Инференс — это не тренировка модели.

Модель уже обучена один раз, а потом её запускают тысячи раз в день на тысячах серверов. Каждый запрос пользователя требует расчёта на GPU. Когда миллионы человек одновременно пишут в ChatGPT, это создаёт огромную нагрузку. У разработчиков два варианта: либо купить ещё GPU, либо жить с очередями. NVIDIA продаёт свои H100 и B100 за сотни тысяч долларов за штуку. OpenAI, Google и Meta покупают их тысячами. При этом платят за электричество (несколько киловатт на один чип) и охлаждение (специальные системы водяного охлаждения). Вот почему подписка на Claude Pro стоит $20 в месяц — это просто инженерия инфраструктуры.

Спасение от нового железа

Производители процессоров видят проблему и выпускают специализированное железо для инференса. NVIDIA готовит серию Blackwell для AI, Intel разрабатывает Gaudi, AMD совершенствует MI300X. Новое поколение обещает: Меньше энергопотребления (на 30–40% дешевле в год на электричество) Выше производительность на ватт (один новый чип заменит два старых) Оптимизация под типичные модели (меньше памяти, быстрее расчёты) Масштабируемость (проще строить ферму из тысяч чипов) По теории, это может снизить операционную стоимость инференса на 25–50%.

Но цены для пользователя не упадут

The Register справедливо напоминает: когда оборудование дешевеет, это редко приводит к снижению цен для конечного потребителя. Вот почему: Во-первых, разработчики всё ещё платят за электричество, стойки, охлаждение и амортизацию старых GPU (которые не исчезают в один день). Во-вторых, компании используют экономию для развития новых фич и расширения числа параметров в моделях — это дорого и требует снова больше GPU. В-третьих, рынок молод. OpenAI, Google и Anthropic ещё устанавливают цены, не конкурируя агрессивно по цене. Они конкурируют по качеству и возможностям. Когда на рынке будет 20 сравнимых сервисов, цены упадут — но это не сегодня.

Что это значит Новое железо — это подарок для компаний, а не для потребителей.

Дешевеющие GPU позволят AI-сервисам остаться прибыльными даже при растущем спросе. Скорее всего, сэкономленное уйдёт на обучение новых моделей, расширение географии и улучшение обслуживания — но не на скидки подписчикам. AI-сервисы останутся дорогими, пока это работает. *Meta признана экстремистской организацией и запрещена в РФ.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Что вы думаете?
Загружаем комментарии…