ZDNet AI→ original

Токены ИИ взвинчивают корпоративные облачные счета — ZDNet фиксирует тренд

ZDNet фиксирует тревожный тренд: корпоративные счета за AI-токены уже напоминают ранний cloud — непредсказуемо, дорого и без понятного ROI. Тогда хотя бы…

Traité par IA depuis ZDNet AI ; édité par Hamidun News
Токены ИИ взвинчивают корпоративные облачные счета — ZDNet фиксирует тренд
Source : ZDNet AI. Collage: Hamidun News.
◐ Écouter l'article

Les dépenses d'entreprise en tokens d'IA deviennent une nouvelle ligne budgétaire que personne ne sait comment contrôler. Les analystes de ZDNet enregistrent une tendance alarmante : la courbe des coûts reproduit l'histoire précoce du cloud — une croissance explosive sans outils d'optimisation clairs et sans réponse à la question de ce que l'entreprise obtient en retour.

Déjà-vu de 2012

Aux débuts du cloud, les directeurs informatiques recevaient des factures pour EC2, S3 et RDS qui croissaient plus vite que n'importe quelle prévision. À l'époque, personne ne savait comment calculer les dépenses par unité de valeur métier. Il a fallu des années, des dizaines d'outils FinOps et des départements entiers de gestion des coûts du cloud pour maîtriser ces dépenses.

Avec les tokens d'IA, l'histoire se répète, mais à un rythme accéléré. Les développeurs connectent GPT-4o, Claude Opus et des modèles fine-tunés propriétaires aux systèmes de produits. Chaque flux de travail d'agents avec appels d'outils, recherche RAG et contexte long peut dépenser de 20 000 à 100 000 tokens par transaction.

Multipliez cela par des milliers d'utilisateurs par jour — et vous avez une facture qui n'a jamais figuré dans aucun budget et qui continue de croître chaque trimestre.

"Les tokens d'IA rappelleront à de nombreux clients d'entreprise la

tarification précoce du cloud", constate ZDNet.

Problème non résolu : comment mesurer la valeur

Le problème principal que ZDNet identifie n'est pas les dépenses elles-mêmes, mais le fait que les entreprises ne savent pas comment mesurer la valeur créée par les tokens d'IA. Dans le monde du cloud, tout était relativement transparent : une instance exécute une tâche, la tâche a un coût en heures-personnes, la différence est l'économie. Avec l'IA, le schéma s'effondre à chaque étape : Un assistant IA accélère la rédaction d'e-mails, mais de combien exactement — personne ne le mesure systématiquement Un agent automatise un processus, mais la qualité de son travail est subjective et inconsistante Un chatbot soulage le support, mais les mesures de satisfaction sur les cas complexes chutent Un assistant de code réduit le temps de développement, mais la dette technique ne disparaît pas * Un système RAG améliore la précision des réponses, mais les benchmarks dépendent de l'ensemble de données et de la tâche spécifique Contrairement aux heures de CPU ou aux gigaoctets de trafic, les tokens n'ont pas de correspondance évidente avec les résultats métier.

Un CFO ne peut pas dire : « Pour ce million de tokens, nous avons obtenu cette valeur mesurable spécifique ». Jusqu'à ce que ce problème soit résolu, les budgets d'IA seront approuvés sur la foi, pas sur les données.

Comment le marché répond

Certains grands clients d'entreprise d'AWS, Azure et Google Cloud voient déjà les dépenses en IA augmenter de 3 à 10 fois d'une année à l'autre. Les fournisseurs répondent en lançant des outils de surveillance de la consommation de tokens — mais pour l'instant, ils montrent principalement des chiffres plutôt que d'aider à optimiser les dépenses. Une nouvelle spécialisation se forme — AI FinOps, dont la tâche est de gérer le coût de l'inférence LLM en production.

Parmi les premiers outils tactiques : Mise en cache des invites pour les demandes répétées Routage des tâches vers des modèles moins chers selon la complexité Limitation de la profondeur du contexte et du nombre d'étapes dans les chaînes d'agents Traitement par lots des demandes au lieu d'appels individuels en temps réel * Audits réguliers des intégrations d'IA inutilisées ou peu performantes Mais c'est de la tactique, pas de la stratégie. L'industrie n'a toujours pas de réponse à la question « combien de tokens devrions-nous dépenser pour obtenir un résultat métier spécifique ? ».

Ce que cela signifie L'IA d'entreprise tombe dans le même piège dans

lequel le cloud est tombé en 2012 : la technologie est largement adoptée, les dépenses croissent rapidement, le ROI est difficile à mesurer. Les entreprises qui ont déjà déployé des LLMs en production devraient investir dans des outils de visibilité des coûts et construire des métriques de valeur dès maintenant — sinon, la conversation avec le directeur financier deviendra un examen maladroit pour lequel personne n'était préparé.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Besoin d'une IA qui travaille dans votre entreprise — pas seulement dans votre fil d'actualité?

Je construis de l'IA en production pour les entreprises — CRM sur mesure, outils internes, agents autonomes, automatisation des processus. Vous en êtes propriétaire, adaptée à votre processus, sans coût par utilisateur. Réalisé par Zhemal Khamidun, CPO d'AlpinaGPT (plateforme IA, 6 000+ utilisateurs).

Qu'en pensez-vous ?
Chargement des commentaires…