3DNews AI→ original

Google révèle l'ampleur : 3,2 quadrillions de tokens IA par mois, une croissance de sept fois

Lors de la conférence I/O 2026, Google a révélé qu'elle traite 3,2 quadrillions de tokens IA par mois, sept fois plus qu'il y a un an. L'entreprise propose…

Traité par IA depuis 3DNews AI ; édité par Hamidun News
Google révèle l'ampleur : 3,2 quadrillions de tokens IA par mois, une croissance de sept fois
Source : 3DNews AI. Collage: Hamidun News.
◐ Écouter l'article

Lors de la conférence Google I/O 2026, le PDG de l'entreprise, Sundar Pichai, a révélé l'ampleur du traitement de l'intelligence artificielle. Google traite mensuellement 3,2 quadrillions de tokens — c'est sept fois plus qu'il y a un an. Il s'agit du déploiement d'infrastructure IA le plus massif de l'histoire de la technologie.

La croissance exponentielle des calculs

Le chiffre de 3,2 quadrillions de tokens par mois reflète la croissance explosive de la demande en IA. La croissance septuple en un an montre que l'infrastructure s'étend de manière non linéaire. Ce n'est pas simplement l'ajout de nouveaux serveurs, mais une réimagination complète de l'architecture sous la pression de la demande.

Google a besoin de tels volumes pour :

  • Le fonctionnement de Gemini dans les résultats de recherche et sur YouTube (des centaines de millions d'utilisateurs)
  • L'intégration de l'IA dans Gmail, Docs, Maps, Photos et autres services grand public
  • L'entraînement et le fine-tuning des nouveaux modèles sur les données internes
  • Le servicing du segment cloud (Google Cloud) pour les clients
  • Les expériences avec de nouveaux formats d'intégration de l'IA dans les produits quotidiens

Une telle ampleur implique que même une petite amélioration de l'efficacité du modèle génère d'énormes économies sur l'électricité et le matériel serveur. Chaque pour cent d'optimisation représente des dizaines de millions de dollars par an.

Gemini 3.5 Flash — optimisation sous charge

C'est pourquoi Google a présenté Gemini 3.5 Flash — une version plus légère de son vaisseau amiral. Le modèle est conçu pour traiter la plupart des tâches routinières avec une consommation de calcul réduite, mais sans pertes critiques de qualité des réponses. Flash allège la charge des modèles principaux, permettant à l'entreprise de distribuer plus efficacement les ressources de calcul. Le coût du traitement d'un token dans Flash est plusieurs fois inférieur à celui des versions complètes. Ce n'est pas un modèle tronqué, mais une solution d'ingénierie pour les tâches réelles qui ne nécessitent pas la puissance maximale.

La course à la suprématie infrastructurelle

Google signale clairement qu'il a investi davantage dans la montée en puissance que ses concurrents. OpenAI ne divulgue pas ces chiffres, mais on sait qu'il augmente également les capacités pour ChatGPT. Le lancement de modèles d'Anthropic, Meta Llama et d'autres acteurs nécessite des volumes de calcul importants. C'est une course aux armements, mais pas pour le nombre de paramètres du modèle, mais pour l'infrastructure elle-même. Celui qui évolue plus vite et moins cher remporte la guerre du marché.

Ce que cela signifie

La divulgation publique de ces chiffres est un signal aux investisseurs sur l'ampleur réelle des enjeux de Google en matière d'IA. L'entreprise ne cache pas que c'est coûteux. Mais les dépenses sont rentabilisées : l'intégration de l'IA dans la recherche, la vidéo, le cloud — ce sont des points de monétisation puissants. Pour les développeurs et les startups, la conclusion est simple : investissez dans l'optimisation, pas simplement dans la montée en puissance.

*Meta est reconnu comme une organisation extrémiste et interdit en Russie.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…