Петер Штайнбергер потратил $1,3 млн на API за месяц экспериментов с OpenClaw
Петер Штайнбергер, создатель OpenClaw, опубликовал отчёт о затратах на OpenAI API за месяц экспериментов с автономным кодированием. Счёт составил $1,3 млн — это
Traité par IA depuis TNW ; édité par Hamidun News
Peter Steinberger, ingénieur chez OpenAI et créateur du projet OpenClaw — un système de génération autonome de code — a récemment publié un rapport financier de son expérience d'un mois. Les chiffres ressemblent à de la science-fiction : en un seul mois, la facture s'est élevée à 1,3 million de dollars. Ce n'est pas une erreur de frappe, ce n'est pas une hypothèse — c'est de l'argent réel dépensé sur l'API OpenAI pour que des machines écrivent du code à l'échelle industrielle.
Comment en est-on arrivé à une telle facture
Pendant 30 jours, Steinberger a exécuté simultanément environ 100 instances de modèles de langage. Chacune fonctionnait en parallèle, résolvant des tâches de codage séparées. En un mois, 603 milliards de jetons ont été traités via 7,6 millions de requêtes API.
Ce n'est pas seulement un grand nombre — c'est une démonstration en direct de ce qui se passe quand un agent IA commence à écrire du code à l'échelle industrielle, sans intervention humaine. Chaque requête à l'API OpenAI coûte de l'argent. Quand vous lancez 100 agents simultanément, et que chacun peut générer des dizaines ou des centaines de requêtes par minute, la facture croît de façon exponentielle.
Ce n'est pas une augmentation linéaire des coûts — c'est une loi de puissance.
Pourquoi c'est cher : l'économie des LLM modernes
- Le prix par jeton n'est pas uniforme dans tous les cas — un contexte long (beaucoup de texte dans le prompt initial) coûte plus cher
- 100 sessions parallèles multiplient les coûts de façon exponentielle, créant un effet d'échelle dans la mauvaise direction
- Chaque requête nécessite un traitement complet du contexte par le modèle — c'est la partie la plus coûteuse en termes de calcul des réseaux transformers
- Les agents longue durée envoient l'ancien contexte dans les nouvelles requêtes, répétant le paiement pour les mêmes jetons
- Pas de remises basées sur le volume en temps réel — OpenAI facture chaque jeton au tarif actuel
Steinberger suggère dans son rapport que la construction d'un produit commercial nécessite des optimisations sérieuses. Par exemple : utiliser la mise en cache des jetons (une nouvelle fonctionnalité de l'API OpenAI qui réduit le coût des requêtes répétées avec le même contexte), le batching — regrouper plusieurs requêtes ensemble, ou utiliser des modèles moins coûteux pour des tâches auxiliaires comme l'analyse de code. Sans ces astuces, la mise à l'échelle de la génération de code autonome devient économiquement irréalisable.
Ce que cela révèle sur les coûts de calcul
Des dépenses de cette ampleur révèlent l'économie réelle et cachée des outils IA. Quand un agent est assez intelligent pour fonctionner pendant des heures sans supervision humaine, le coût devient visible et inévitable. Ce n'est pas une critique envers OpenAI — c'est la mathématique des coûts de calcul. Les transformers sont coûteux à exécuter en inférence, et aucune optimisation ne changera cela radicalement.
"Si vous lancez un agent totalement autonome qui fonctionne longtemps et change fréquemment de modèle, votre facture décollera simplement," — c'est à peu près comment
Steinberger a résumé le problème central.
Ce qui changera sur le marché
Pour les développeurs et les startups, c'est un signal important : la génération de code par IA à l'échelle nécessite non seulement des connaissances techniques, mais aussi une compréhension profonde des coûts de calcul. Nous verrons probablement une vague d'optimisations. Les entreprises chercheront des moyens de réduire le prix effectif par jeton, utiliseront des modèles plus légers pour les brouillons et l'analyse contextuelle, mettront en cache et réutiliseront les contextes autant que possible.
Pour OpenAI, cela peut signifier l'émergence de nouveaux plans tarifaires pour les utilisateurs de fort volume — quelque chose comme des remises en gros, des tarifs contractuels, ou des solutions spéciales pour l'entreprise. L'époque où la génération de code par IA était bon marché et accessible à tous prend fin. Nous entrons dans une ère d'utilisation réfléchie et optimisée financièrement des agents autonomes.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.