Claude и AI-агенты сжигают токены быстрее прогнозов — бизнес учится «токеномике»
Компании, внедрившие AI-агентов для написания кода, столкнулись с «безумным» расходом токенов — в разы превышающим прогнозы. Silicon Valley–разработчик ПО и…
Traité par IA depuis Wired ; édité par Hamidun News
Les entreprises qui ont déployé des agents IA pour l'écriture de code ont rencontré un problème inattendu : les coûts réels des tokens se sont avérés être significativement plus élevés que prévu — et maintenant leurs dirigeants apprennent urgemment une nouvelle discipline appelée « tokenomique ».
Ce Qui s'est Passé avec les Budgets
Wired a parlé avec plusieurs entreprises sur la façon dont elles gèrent les dépenses des agents IA dans des conditions réelles. Une source — directeur d'une entreprise de développement de logiciels de la Silicon Valley — a décrit ce qui se passe avec le mot « folie » : son équipe a commencé à utiliser activement Claude d'Anthropic pour le codage, et la consommation de tokens a grimpé à des niveaux que personne n'avait budgétisés. Une situation similaire dans une entreprise de commerce électronique : les agents IA travaillant en arrière-plan génèrent des milliers de tokens pour des tâches qui semblent routinières — révision de code, rédaction de tests, refactorisation.
Si un développeur passe une heure sur une telle tâche, l'agent « réfléchit » pendant quelques minutes, mais génère continuellement des tokens au cours du processus — et la facture mensuelle s'avère être complètement différente.
Pourquoi les Agents Brûlent les Tokens si Rapidement
Un token est une unité de facturation auprès des fournisseurs d'IA. Chaque requête à un modèle et chaque réponse est facturée en fonction du nombre de tokens. Pour un chat normal, c'est à peine perceptible. Mais les agents IA pour le codage fonctionnent selon un principe fondamentalement différent :
- avant chaque action, ils lisent tout le contexte du référentiel
- au sein d'une seule tâche, ils appellent le modèle à plusieurs reprises
- génèrent de longues chaînes de raisonnement interne avant de répondre
- écrivent, testent et réécrivent le code jusqu'à obtenir le résultat souhaité
En conséquence, une tâche qu'un développeur résout en une heure peut « coûter » des dizaines de milliers de tokens. Aux tarifs élevés des modèles puissants comme Claude — c'est des centaines de dollars par jour ouvrable par employé.
Comment les Entreprises Restructurent leur Approche
Les dirigeants commencent à introduire le concept de « tokenomique » — gérer la consommation de tokens de la même manière qu'ils géraient auparavant les ressources serveur ou les dépenses cloud. Les premières pratiques se sont déjà formées :
- limitation des fenêtres de contexte des agents : les agents ne voient que la partie pertinente de la base de code
- mise en cache des prompts répétés pour que les tokens ne soient pas recalculés à partir de zéro
- routage des tâches : modèles bon marché pour le travail routinier, modèles puissants pour les demandes complexes
- surveillance et alertes pour les dépenses anormales
- réévaluation du ROI des outils IA en fonction des coûts réels, et non prévus
« Nous avions l'habitude de penser à l'IA comme à un abonnement SaaS à prix fixe.
Maintenant, nous comprenons que c'est plutôt comme l'informatique en nuage : le prix dépend de votre utilisation. »
Anthropic et d'autres fournisseurs offrent des outils pour surveiller les dépenses, mais la gestion des tokens reste un problème du côté du client.
Ce Que Cela Signifie
Un pari commercial sur le codage par IA comme moyen de réduire les dépenses de développement pourrait ne pas être rentable si le vrai coût des tokens n'est pas pris en compte. Les entreprises qui maîtriseront d'abord la « tokenomique » — apprendront à optimiser la consommation sans sacrifier les résultats — obtiendront un avantage tangible sur celles qui gèrent les coûts de l'IA à l'aveugle.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.
L'essentiel de l'IA — une fois par semaine
Sept actus qui ont vraiment compté, choisies à la main. Sans bruit ni communiqués.
C'est fait ! Vérifiez votre boîte mail pour la confirmation.