3DNews AI→ original

Meta a dévoilé un plan pour quatre puces AI MTIA dédiées à l’inférence, sans pour autant abandonner Nvidia et AMD

Meta a dévoilé la feuille de route de quatre accélérateurs MTIA, appelés à prendre en charge une part croissante des charges de travail AI dans les centres…

Traité par IA depuis 3DNews AI ; édité par Hamidun News
Meta a dévoilé un plan pour quatre puces AI MTIA dédiées à l’inférence, sans pour autant abandonner Nvidia et AMD
Source : 3DNews AI. Collage: Hamidun News.
◐ Écouter l'article

Meta a révélé un plan pour développer sa propre ligne d'accélérateurs d'IA MTIA : au cours des deux prochaines années, l'entreprise souhaite lancer quatre générations de puces pour les tâches de classement, de recommandation et d'IA générative. Cependant, il ne sera pas possible d'abandonner complètement Nvidia et AMD — Meta considère son propre silicium comme un complément aux achats de matériel tiers, et non comme un remplacement immédiat.

Pourquoi Meta a besoin de ses propres puces

La raison principale est simple : la charge d'infrastructure de Meta augmente trop rapidement, et les GPU universels deviennent de plus en plus chers. L'entreprise étend la capacité des centres de données pour Facebook, Instagram et ses propres services génératifs, elle essaie donc d'obtenir plus de contrôle sur les coûts d'inférence — l'étape où un modèle est déjà entraîné et répond aux requêtes des utilisateurs. Pour un tel travail, l'accélérateur le plus polyvalent n'est pas toujours nécessaire.

Parfois, il est plus rentable de créer une puce pour des scénarios internes spécifiques et d'extraire la meilleure efficacité par watt et par dollar. Meta affirme qu'elle utilise déjà des centaines de milliers de puces MTIA pour l'inférence dans les recommandations, le contenu organique et la publicité. Essentiellement, il ne s'agit pas d'une expérience de laboratoire, mais d'une partie intégrée de l'infrastructure de production.

Dans ce contexte, l'entreprise accélère le développement de nouvelles générations. Un autre chiffre significatif : en 2026, Meta s'attend à des dépenses en immobilisations au niveau de $115–135 milliards, et une part importante de ces investissements va à l'infrastructure d'IA. Ses propres accélérateurs devraient aider non seulement à se développer plus rapidement, mais aussi à réduire la dépendance aux prix et aux approvisionnements des fournisseurs externes.

À quoi ressemble la feuille de route

Au centre de la nouvelle feuille de route se trouvent quatre puces MTIA que Meta prévoit de déployer à une vitesse beaucoup plus rapide que celle typique dans l'industrie. Alors que de nombreuses puces d'IA sont mises à jour tous les un à deux ans, Meta souhaite progresser par intervalles d'environ six mois. Cela a été rendu possible grâce à une approche modulaire : les nouvelles générations sont conçues pour s'adapter à des baies déjà préparées et à une infrastructure réseau sans refonte complète du site.

  • MTIA 300 est déjà en production et conçue pour les tâches de classement et de recommandation.
  • MTIA 400 sera l'étape suivante et, selon l'entreprise, se prépare pour le déploiement dans les centres de données de Meta.
  • MTIA 450 est conçue principalement pour l'inférence d'IA générative.
  • MTIA 500 continuera dans la même ligne et devrait renforcer l'infrastructure en 2027.

À partir de MTIA 400, Meta conçoit non seulement la puce elle-même, mais un système complet autour d'elle : plusieurs baies de serveurs, réseau et refroidissement liquide. Cette approche est importante car dans les grands clusters d'IA, les limites de performance sont depuis longtemps limitées non seulement par le calcul, mais aussi par la livraison des données, la consommation d'énergie et la dissipation thermique. Plus l'entreprise optimise la pile complète, moins elle paie pour la polyvalence dont elle n'a pas toujours besoin.

Pourquoi ce n'est pas un remplacement pour Nvidia

Malgré l'annonce très médiatisée, Meta ne positionne pas directement MTIA comme une alternative qui supplanter Nvidia ou AMD de ses centres de données. Au contraire, l'entreprise parle d'une approche de « portefeuille » : différents types de charges de travail nécessitent différentes puces, et il n'existe tout simplement pas une solution universelle pour tout. Dans les années à venir, les accélérateurs externes resteront critiquement importants, en particulier là où les scénarios les plus lourds d'entraînement de grands modèles ou d'accès rapide aux écosystèmes de matériel et de logiciel déjà établis sont nécessaires.

Le pari de Meta est différent : transférer sur ses propres puces les charges de travail où vous pouvez obtenir le maximum de gains en prix et en efficacité. En même temps, l'entreprise essaie de ne pas construire un écosystème fermé. MTIA est initialement conçue en s'appuyant sur des outils familiers de l'industrie — PyTorch, vLLM, Triton et les normes de l'Open Compute Project.

Cela simplifie le déploiement dans les centres de données existants. Une partie du développement est menée en collaboration avec Broadcom, et la fabrication est confiée à TSMC, donc même le silicium « propre » a une longue chaîne externe de partenaires.

Ce que cela signifie

Meta démontre que la course au matériel d'IA se déplace du simple achat des GPU les plus puissants vers un modèle plus sophistiqué : les grandes plateformes assemblent une flotte mixte d'accélérateurs tiers et propriétaires. Pour le marché, c'est un signal que la pénurie principale au cours des prochaines années ne sera pas seulement les puces elles-mêmes, mais aussi la capacité à adapter rapidement l'infrastructure à des types spécifiques de charges de travail d'IA.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…