Bloomberg Tech→ original

Meta prépare quatre générations de puces MTIA pour réduire sa dépendance à Nvidia et AMD

Meta a déjà mis MTIA 300 en production et prépare encore trois générations de ses propres puces AI d’ici fin 2027. L’entreprise veut réduire le coût de…

Traité par IA depuis Bloomberg Tech ; édité par Hamidun News
Meta prépare quatre générations de puces MTIA pour réduire sa dépendance à Nvidia et AMD
Source : Bloomberg Tech. Collage: Hamidun News.
◐ Écouter l'article

Meta accélère considérablement son propre programme de puces : l'entreprise a déjà lancé le MTIA 300 en production et prévoit de sortir trois autres générations d'accélérateurs avant la fin de 2027. L'objectif est simple — réduire la dépendance envers Nvidia et AMD dans la course à la puissance de calcul pour les recommandations, la publicité et l'IA générative.

Pourquoi Meta a besoin de ses propres puces

La charge d'infrastructure de Meta augmente dans plusieurs directions. L'entreprise a besoin de capacité à la fois pour les traditionnels systèmes de classement de contenu sur Facebook et Instagram, et pour l'IA générative qui répond aux requêtes, crée des images et soutient d'autres produits de son écosystème. Tout acheter uniquement auprès de fournisseurs externes est trop cher et risqué : la demande d'accélérateurs est élevée, les délais de livraison sont longs, et les marges dépendent fortement des prix du matériel tiers.

C'est pourquoi Meta mise sur sa propre ligne MTIA — Meta Training and Inference Accelerator. Elle n'a pas abandonné ses partenaires et a déjà signé des accords multi-milliardaires avec Nvidia et AMD, mais en parallèle elle essaie de gérer certaines tâches avec son propre silicium. La logique est que les puces internes n'ont pas besoin d'être universelles comme les GPU commerciales.

Elles peuvent être plus précisément adaptées aux scénarios spécifiques de Meta et ainsi réduire les coûts d'inférence.

Feuille de route du MTIA

Meta dispose maintenant d'un plan assez clair pour plusieurs générations. L'entreprise affirme qu'elle peut sortir une nouvelle puce environ tous les six mois — notablement plus vite que le cycle habituel de l'industrie, où il s'écoule souvent un ou deux ans entre les générations. Une architecture modulaire aide : les nouveaux accélérateurs peuvent être intégrés dans des racks déjà préparés et dans l'infrastructure réseau des centres de données.

  • MTIA 300 fonctionne déjà en production et est utilisé pour entraîner les modèles de classement et de recommandation.
  • MTIA 400 a réussi les tests de laboratoire et se prépare au déploiement dans les centres de données.
  • MTIA 450 est conçu principalement pour l'inférence d'IA et devrait être déployé en volume au début de 2027.
  • MTIA 500 est prévu pour la deuxième moitié de 2027 comme la prochaine étape de la même ligne.

Selon Meta, la transition de MTIA 300 à MTIA 500 devrait délivrer environ 4,5x de croissance du débit de mémoire HBM et 25x de croissance de la performance de calcul. L'entreprise met un accent particulier sur l'inférence : cette étape, quand le modèle répond déjà à l'utilisateur, devient le scénario le plus coûteux et le plus répandu pour les services avec un public de milliards d'utilisateurs.

«

Au cours des deux à trois derniers mois, le rythme du développement de l'IA s'est à nouveau accéléré considérablement, et les programmes de silicium doivent suivre l'évolution des charges de travail. »

Où sont les goulets d'étranglement

Le problème est que développer ses propres puces n'est pas seulement coûteux, mais très lent et risqué. Du design à la production en usine, il faut généralement environ deux ans, et le raffinement réel du produit coûte des milliards de dollars. Un tel projet ne s'amortit que si l'entreprise peut charger le matériel à grande échelle et comprend clairement quelles tâches seront pertinentes au moment du lancement.

Il a été rapporté précédemment que Meta a abandonné sa puce d'entraînement la plus avancée, Olympus, après des problèmes de design et a recentré ses efforts sur une version plus simple. Pour accélérer le programme, Meta a tenté d'acheter la startup sud-coréenne FuriosaAI pour 800 millions de dollars, et après cet échec, a acquis Rivos avec plus de 400 employés. Cela montre que la pénurie dans cette course ne concerne pas seulement les GPU, mais aussi les ingénieurs qui savent comment construire du silicium complexe pour centres de données.

Ce que cela signifie

Meta ne construit pas un remplacement de Nvidia comme « une seule grosse puce », mais plutôt un modèle hybride : elle continuera à acheter une partie de son infrastructure en externe, tout en transférant progressivement une partie du travail vers son propre MTIA. Si l'entreprise maintient le rythme des lancements et réussit effectivement à réduire les coûts d'inférence, elle obtiendra un avantage important dans la course à l'IA : un meilleur contrôle sur les coûts, les délais et le lancement de nouvelles fonctionnalités pour des milliards d'utilisateurs.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…