Meta transfère l'IA agentive sur des dizaines de millions de cœurs AWS Graviton au lieu de GPU
Meta étend son partenariat avec AWS et transfère une partie de ses charges de travail d'IA vers les processeurs Graviton. Il ne s'agit pas de GPUs pour…
Traité par IA depuis TechCrunch ; édité par Hamidun News
Meta parie effectivement sur une nouvelle couche d'infrastructure d'IA : l'entreprise a signé un accord avec AWS pour déployer des dizaines de millions de cœurs Graviton pour les charges de travail d'IA basées sur des agents. Il ne s'agit pas simplement d'un autre achat de GPU pour l'entraînement de modèles, mais d'un signe que le marché commence à se diviser en deux grandes directions. L'une implique l'entraînement de modèles de plus en plus grands sur des accélérateurs.
La deuxième implique de desservir un grand nombre de scénarios basés sur des agents après l'entraînement, où la performance maximale importe moins que le coût, l'efficacité énergétique et la performance prévisible à l'échelle. Selon une annonce officielle d'Amazon du 24 avril 2026, le déploiement commence avec des dizaines de millions de cœurs Graviton et peut être étendu à mesure que les besoins de Meta augmentent. Amazon note que Meta est déjà devenue l'un des plus grands clients de Graviton au monde.
Nous parlons de CPUs AWS Graviton, pas de GPUs : ce sont des processeurs ARM développés par Amazon, disponibles via le cloud AWS. Meta prévoit d'exécuter une partie de son infrastructure supportant ses services d'IA et traitant des milliards d'interactions sur ces cœurs, où des flux de travail complexes multi-étapes doivent être coordonnés.
Pourquoi c'est important : l'essor de l'IA basée sur des agents change la structure même de la demande de matériel. Les GPUs restent essentielles lors de l'entraînement de grands modèles ou de l'exécution d'une inférence particulièrement lourde. Mais une fois que les agents sont superposés à ces modèles, la proportion de différents types de tâches augmente rapidement — raisonnement en temps réel, génération de code, recherche, planification de séquences d'actions, orchestration d'appels d'outils et gestion de longues chaînes d'étapes.
Ces charges de travail affectent souvent non seulement les accélérateurs, mais aussi le CPU, la mémoire, la communication inter-nœuds et le coût de chaque requête. Pour des entreprises à l'échelle de Meta, ce n'est plus un détail technique mais une question économique pour toute la plateforme d'IA. Pour AWS, l'accord avec Meta est plusieurs victoires à la fois.
Premièrement, Amazon obtient un signal de marché très visible : ses propres puces peuvent être utilisées non seulement au sein d'AWS, mais aussi dans l'une des infrastructures d'IA les plus exigeantes du monde. Deuxièmement, cela aide à ramener une partie des dépenses de Meta vers AWS. En août 2025, Meta a signé un accord cloud de six ans avec Google Cloud pour plus de 10 milliards de dollars, et dans ce contexte, le nouveau contrat avec Amazon ressemble à un pas vers un schéma d'achat de calcul plus diversifié.
Troisièmement, AWS renforce sa position dans un nouveau segment : non seulement « cloud pour modèles », mais fournisseur d'une pile complète pour l'IA basée sur des agents.
Il y a aussi un autre contexte. Le 20 avril 2026, Anthropic a annoncé l'expansion de son partenariat avec Amazon et l'engagement de dépenser plus de 100 milliards de dollars sur AWS sur dix ans, y compris une capacité basée sur Trainium. Dans ce contexte, le partenariat Meta-Graviton montre qu'Amazon essaie de s'établir dans plusieurs couches d'infrastructure d'IA : sur les accélérateurs pour l'entraînement et l'inférence, et séparément sur les CPUs pour les charges de travail basées sur les agents et les services.
L'argument supplémentaire d'Amazon est l'économie. Graviton5, selon l'entreprise, a été créé spécifiquement pour ces scénarios, offrant jusqu'à 192 cœurs, un cache plus grand et jusqu'à 25% d'amélioration de performances par rapport à la génération précédente. Pour les clients, cela signifie une tentative de réduire le coût des opérations d'IA sans sacrifier l'échelle.
La conclusion principale est simple : la course aux puces d'IA ne se réduit plus à la pénurie de GPU et à la domination de Nvidia. Les grands acteurs commencent à assembler des piles de calcul hybrides, où chaque catégorie de matériel gère son propre domaine : GPUs pour l'entraînement, accélérateurs spécialisés pour une partie de l'inférence, CPUs pour l'orchestration, les chaînes d'agents et les charges de travail d'applications massives. L'accord Meta-AWS montre que la prochaine bataille concerne qui fournira le meilleur prix par unité de travail d'IA utile.
Et si les produits basés sur des agents deviennent véritablement l'interface principale pour les modèles, la demande de telles architectures CPU croîtra pas moins rapidement que la demande d'accélérateurs d'IA classiques.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.