Bloomberg Tech→ original

Google dévoile de nouvelles puces AI pour l'inférence et défie Nvidia

Google développe une nouvelle génération de puces AI axées sur l'inférence, un défi direct à Nvidia. Cerebras a annoncé des plans d'IPO plusieurs mois après…

Traité par IA depuis Bloomberg Tech ; édité par Hamidun News
Google dévoile de nouvelles puces AI pour l'inférence et défie Nvidia
Source : Bloomberg Tech. Collage: Hamidun News.
◐ Écouter l'article

Google défie Nvidia : l'entreprise développe une nouvelle génération de ses propres puces d'IA axées sur l'inférence — l'étape finale de fonctionnement des réseaux de neurones, lorsqu'un modèle entraîné traite les demandes des utilisateurs en temps réel. Les puces d'inférence sont fondamentalement différentes de celles nécessaires pour l'entraînement des modèles. L'entraînement de grands systèmes linguistiques est des mois de calcul sur des milliers de GPU, une dépense en capital unique.

L'inférence est une charge constante : chaque fois qu'un utilisateur envoie une demande à Gemini, ChatGPT ou tout autre service d'IA, la puce effectue l'inférence. À mesure que les applications d'IA atteignent des centaines de millions d'utilisateurs, les coûts d'inférence deviennent le principal poste de dépenses pour les entreprises technologiques. Selon certaines estimations, d'ici 2027, ils dépasseront les coûts d'entraînement de trois à quatre fois.

Google construit sa propre stratégie de silicium depuis longtemps. L'entreprise développe les TPU (Tensor Processing Units) depuis 2015 — bien avant que les puces d'IA ne deviennent l'actualité de première page. Jusqu'à présent, ces processeurs ont été utilisés principalement au sein de Google Cloud et pour l'entraînement des modèles Gemini.

Maintenant, l'entreprise a l'intention de créer du matériel spécialisé spécifiquement pour l'inférence — avec un débit plus élevé et une consommation d'énergie inférieure par demande. Pour Nvidia, dont les puces H100 et H200 sont devenues la norme pour les centres de données du monde entier, c'est un défi direct. Google est l'un des plus grands clients de Nvidia au monde, et le transfert d'une partie seulement de la charge vers du matériel propriétaire signifie des pertes importantes pour l'entreprise de Santa Clara.

En parallèle, un autre événement se profile dans le secteur des puces d'IA : Cerebras Systems a annoncé son intention d'entrer en bourse. L'entreprise est connue pour son produit phare — le Wafer-Scale Engine, essentiellement une plaquette de silicium entière fonctionnant comme un seul processeur. Cette architecture élimine les latences lors du transfert de données entre puces individuelles et accélère le traitement des grands modèles.

Cerebras a déjà tenté un IPO auparavant mais a retiré la demande. Retourner sur le marché des IPO est un signal au marché : malgré le refroidissement de certains investisseurs en IA, les architectures de puces alternatives continuent d'être perçues comme des actifs prometteurs. L'entreprise positionne ses solutions comme particulièrement efficaces pour travailler avec des modèles ouverts dans des environnements corporatifs fermés — un segment en croissance rapide stimulé par les exigences de sécurité et de souveraineté des données.

La troisième histoire de la semaine vient de l'espace. Blue Origin a lancé avec succès la fusée New Glenn et a atterri son propulseur réutilisable — une étape technique importante vers la réduction des coûts de lancement. Cependant, la charge utile, le satellite AST SpaceMobile, n'a pas atteint son orbite calculée.

AST SpaceMobile construit un réseau mondial d'internet haut débit qui fonctionne directement à partir des smartphones sans terminaux spécialisés. L'échec orbital a immédiatement affecté le prix des actions : les actions de l'entreprise ont chuté. Le marché a rappelé une fois de plus qu'en espace, le succès technique et le succès commercial sont deux choses différentes.

Les trois histoires ensemble peignent un portrait de l'économie technologique du milieu des années 2020. La course aux puces d'IA sort du duopole : au-delà de Nvidia et AMD, des géants technologiques ayant leur propre silicium et des startups spécialisées comme Cerebras entrent en lice pour l'infrastructure. La question de savoir qui contrôlera l'infrastructure physique de l'ère de l'IA reste ouverte.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…