ZDNet AI→ оригинал

Токены ИИ взвинчивают корпоративные облачные счета — ZDNet фиксирует тренд

ZDNet фиксирует тревожный тренд: корпоративные счета за AI-токены уже напоминают ранний cloud — непредсказуемо, дорого и без понятного ROI. Тогда хотя бы…

AI-обработка оригинала ZDNet AI; редакция Hamidun News
Токены ИИ взвинчивают корпоративные облачные счета — ZDNet фиксирует тренд
Источник: ZDNet AI. Коллаж: Hamidun News.
◐ Слушать статью

Корпоративные расходы на AI-токены превращаются в новую статью бюджета, которую никто не умеет контролировать. Аналитики ZDNet фиксируют тревожный тренд: кривая затрат повторяет раннюю историю облака — бурный рост без понятных инструментов оптимизации и без ответа на вопрос, что именно бизнес получает взамен.

Дежавю из 2012 года В начале облачной эпохи ИТ-директора получали

счета за EC2, S3 и RDS, которые росли быстрее любых прогнозов. Тогда никто не умел считать расходы на единицу бизнес-ценности. Потребовались годы, десятки инструментов FinOps и целые отделы cloud cost management, чтобы взять эти расходы под контроль. С AI-токенами история воспроизводится, но в сжатом темпе. Разработчики подключают GPT-4o, Claude Opus и собственные дообученные модели к продуктовым системам. Каждый агентный workflow с инструментальными вызовами, RAG-поиском и длинным контекстом может тратить от 20 000 до 100 000 токенов за одну транзакцию. Умножьте это на тысячи пользователей в день — и получите счёт, которого не было ни в одном бюджете и который продолжает расти каждый квартал.

«AI-токены напомнят многим корпоративным клиентам о раннем облачном

прайсинге», — констатирует ZDNet.

Нерешённая задача: как измерить ценность

Главная проблема, которую фиксирует ZDNet, — не сами расходы, а то, что компании не умеют измерять ценность, которую создают токены ИИ. В облачном мире всё было относительно прозрачно: инстанс выполняет задачу, задача имеет стоимость в человеко-часах, разница — это экономия. С ИИ схема ломается на каждом шагу: ИИ-ассистент ускоряет написание письма, но насколько именно — никто не замерял систематически Агент автоматизирует процесс, но качество его работы субъективно и непостоянно Чат-бот разгружает поддержку, но метрики удовлетворённости в сложных кейсах падают Код-ассистент снижает время разработки, но технический долг никуда не исчезает * RAG-система улучшает точность ответов, но бенчмарки зависят от датасета и конкретной задачи В отличие от CPU-часов или гигабайт трафика, токены не имеют очевидного соответствия бизнес-результату.

CFO не может сказать: «На этот миллион токенов мы получили вот такую конкретную измеримую ценность». Пока эта проблема не решена, AI-бюджеты будут утверждаться на веру, а не на основе данных.

Как реагирует рынок

Некоторые крупные корпоративные клиенты AWS, Azure и Google Cloud уже фиксируют рост AI-расходов в 3-10 раз год к году. Провайдеры в ответ выпускают инструменты мониторинга токен-потребления — но пока они преимущественно показывают цифры, а не помогают оптимизировать расходы. Формируется новая специализация — AI FinOps, задача которой управлять стоимостью LLM-инференса в production. Среди первых тактических инструментов: Кеширование промптов для повторяющихся запросов Маршрутизация задач к более дешёвым моделям в зависимости от сложности Ограничение глубины контекста и числа шагов агентных цепочек Батчинг запросов вместо единичных вызовов в реальном времени * Регулярный аудит неиспользуемых или малоэффективных AI-интеграций Но это тактика, а не стратегия. Ответа на вопрос «сколько токенов стоит потратить, чтобы получить конкретный бизнес-результат» у индустрии пока нет.

Что это значит

Корпоративный ИИ входит в ту же ловушку, что и облако в 2012-м: технология принята широко, расходы растут быстро, ROI измерить сложно. Компаниям, которые уже развернули LLM в production, стоит инвестировать в инструменты видимости затрат и выстраивать метрики ценности прямо сейчас — иначе разговор с финансовым директором превратится в неудобный экзамен, к которому никто не готовился.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…