Claude и AI-агенты сжигают токены быстрее прогнозов — бизнес учится «токеномике»

Компании, внедрившие AI-агентов для написания кода, столкнулись с «безумным» расходом токенов — в разы превышающим прогнозы. Silicon Valley–разработчик ПО и…

Rédaction de Hamidun News

Veille IA · Wired

28 juin 2026· 2 min

Traité par IA depuis Wired ; édité par Hamidun News

Claude и AI-агенты сжигают токены быстрее прогнозов — бизнес учится «токеномике» — Source : Wired. Collage: Hamidun News.

◐ Écouter l'article

Les entreprises qui ont déployé des agents IA pour l'écriture de code ont rencontré un problème inattendu : les coûts réels des tokens se sont avérés être significativement plus élevés que prévu — et maintenant leurs dirigeants apprennent urgemment une nouvelle discipline appelée « tokenomique ».

Ce Qui s'est Passé avec les Budgets

Wired a parlé avec plusieurs entreprises sur la façon dont elles gèrent les dépenses des agents IA dans des conditions réelles. Une source — directeur d'une entreprise de développement de logiciels de la Silicon Valley — a décrit ce qui se passe avec le mot « folie » : son équipe a commencé à utiliser activement Claude d'Anthropic pour le codage, et la consommation de tokens a grimpé à des niveaux que personne n'avait budgétisés. Une situation similaire dans une entreprise de commerce électronique : les agents IA travaillant en arrière-plan génèrent des milliers de tokens pour des tâches qui semblent routinières — révision de code, rédaction de tests, refactorisation.

Si un développeur passe une heure sur une telle tâche, l'agent « réfléchit » pendant quelques minutes, mais génère continuellement des tokens au cours du processus — et la facture mensuelle s'avère être complètement différente.

Pourquoi les Agents Brûlent les Tokens si Rapidement

Un token est une unité de facturation auprès des fournisseurs d'IA. Chaque requête à un modèle et chaque réponse est facturée en fonction du nombre de tokens. Pour un chat normal, c'est à peine perceptible. Mais les agents IA pour le codage fonctionnent selon un principe fondamentalement différent :

avant chaque action, ils lisent tout le contexte du référentiel
au sein d'une seule tâche, ils appellent le modèle à plusieurs reprises
génèrent de longues chaînes de raisonnement interne avant de répondre
écrivent, testent et réécrivent le code jusqu'à obtenir le résultat souhaité

En conséquence, une tâche qu'un développeur résout en une heure peut « coûter » des dizaines de milliers de tokens. Aux tarifs élevés des modèles puissants comme Claude — c'est des centaines de dollars par jour ouvrable par employé.

Comment les Entreprises Restructurent leur Approche

Les dirigeants commencent à introduire le concept de « tokenomique » — gérer la consommation de tokens de la même manière qu'ils géraient auparavant les ressources serveur ou les dépenses cloud. Les premières pratiques se sont déjà formées :

limitation des fenêtres de contexte des agents : les agents ne voient que la partie pertinente de la base de code
mise en cache des prompts répétés pour que les tokens ne soient pas recalculés à partir de zéro
routage des tâches : modèles bon marché pour le travail routinier, modèles puissants pour les demandes complexes
surveillance et alertes pour les dépenses anormales
réévaluation du ROI des outils IA en fonction des coûts réels, et non prévus

« Nous avions l'habitude de penser à l'IA comme à un abonnement SaaS à prix fixe.

Maintenant, nous comprenons que c'est plutôt comme l'informatique en nuage : le prix dépend de votre utilisation. »

Anthropic et d'autres fournisseurs offrent des outils pour surveiller les dépenses, mais la gestion des tokens reste un problème du côté du client.

Ce Que Cela Signifie

Un pari commercial sur le codage par IA comme moyen de réduire les dépenses de développement pourrait ne pas être rentable si le vrai coût des tokens n'est pas pris en compte. Les entreprises qui maîtriseront d'abord la « tokenomique » — apprendront à optimiser la consommation sans sacrifier les résultats — obtiendront un avantage tangible sur celles qui gèrent les coûts de l'IA à l'aveugle.

Hamidun News

Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Canal Telegram RSS hamidun.com

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

🎓 Academy — 7 jours gratuits Consultation gratuite