Google construit une chaîne d'approvisionnement de puces avec quatre partenaires pour défier Nvidia dans l'inférence d'IA
Google forme une chaîne d'approvisionnement de puces d'IA avec quatre partenaires pour défier Nvidia en inférence. Les partenaires incluent Broadcom…
Traité par IA depuis TNW ; édité par Hamidun News
Google a annoncé la construction de la chaîne d'approvisionnement de puces personnalisées la plus diversifiée de l'industrie de l'IA—avec quatre partenaires de conception et une feuille de route s'étendant jusqu'à la fin de 2027. L'entreprise parie sur la réduction de la dépendance du marché du cloud envers Nvidia dans le segment de l'inférence IA. Le réseau de partenaires de Google comprend quatre grands acteurs : Broadcom, MediaTek, Marvell et Intel. Chacun est responsable d'une direction distincte dans l'architecture et la fabrication des puces. La stratégie a été détaillée avant Google Cloud Next—l'événement annuel clé de l'entreprise pour les clients et partenaires d'entreprise.
Le premier produit de cet écosystème est la Ironwood TPU—une puce de nouvelle génération qui est déjà expédiée en millions d'exemplaires. C'est le premier signal que Google cesse d'être simplement un consommateur de matériel tiers et devient systématiquement un acteur autonome sur le marché de l'infrastructure IA. Le jalon final de la feuille de route est marqué par les puces TPU v8, qui seront fabriquées en utilisant le procédé 2nm de TSMC et arriveront au second semestre 2027.
La stratégie de Google divise les prochaines générations de TPU en plusieurs flux indépendants—par partenaires de conception et capacité de fabrication. Cette approche assure une protection contre les perturbations d'approvisionnement caractéristiques de la dépendance à un seul fournisseur et offre une flexibilité dans l'adaptation des performances à différentes tâches d'inférence.
L'inférence—c'est-à-dire exécuter des modèles déjà entraînés pour générer des réponses aux utilisateurs—est devenue le principal champ de bataille du marché des puces IA en 2025–2026. C'est ici que se concentre la demande primaire des principaux fournisseurs de cloud : l'entraînement du modèle se fait une fois, tandis que l'inférence s'exécute en continu. Nvidia maintient sa domination grâce à son architecture GPU et son écosystème CUDA mature ; cependant, les TPU personnalisées de Google démontrent traditionnellement une efficacité énergétique supérieure sur les tâches de modèles de transformateurs.
Pour le marché, cela signifie une intensification de la concurrence dans le segment du matériel IA du cloud. Si Google parvient à dimensionner sa propre chaîne d'approvisionnement aux volumes requis, ses clients auront une véritable alternative aux clusters GPU de Nvidia—avec un coût potentiellement plus bas par token d'inférence et une dépendance réduite envers un seul fournisseur.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.