Jiqizhixin (机器之心)→ original

Le triangle d'or d'Alibaba : comment ses propres puces sauvent l'empire du cloud

Tandis que le monde occidental retenait son souffle en attente de la prochaine livraison de NVIDIA, un jeu tout à fait différent se déroulait à l'Est…

Traité par IA depuis Jiqizhixin (机器之心) ; édité par Hamidun News
Le triangle d'or d'Alibaba : comment ses propres puces sauvent l'empire du cloud
Source : Jiqizhixin (机器之心). Collage: Hamidun News.
◐ Écouter l'article

Tandis que le monde occidental retenait son souffle en attente de la prochaine livraison de NVIDIA, un jeu tout à fait différent se déroulait à l'Est. Alibaba a décidé de montrer ce qu'il y a sous le capot de sa machine IA, et ce spectacle nous oblige à réfléchir à la situation réelle de l'industrie. Nous parlons du soi-disant « triangle d'or, » où convergent les puces propriétaires, l'infrastructure cloud et les grands modèles de langage.

Ce n'est pas simplement une diapositive corporative pour les investisseurs, mais une tentative d'autonomie technologique complète dans un monde où l'accès à du matériel puissant est devenu un instrument de géopolitique. Le fondement de cette construction est la division Pingtouge — l'aile des semi-conducteurs d'Alibaba, qui est restée longtemps dans l'ombre. Le nom fait référence au blaireau de miel, une créature intrépide qui n'a pas peur de s'engager contre un adversaire supérieur.

L'ironie est tout à fait appropriée ici : Pingtouge défie effectivement l'ordre établi en créant des accélérateurs IA spécialisés appelés Hanguang. Contrairement aux processeurs graphiques universels, ces puces sont conçues pour des tâches spécifiques du cloud d'Alibaba, ce qui permet d'extraire l'efficacité maximale là où les solutions ordinaires commencent à « suffoquer » par surchauffe ou manque de mémoire.

Le deuxième angle du triangle est Alibaba Cloud. Dans la réalité moderne, une puce en elle-même est simplement un morceau de silicium. La vraie magie commence quand elle s'intègre facilement dans l'environnement cloud. Alibaba a structuré son système de manière à ce que sa plateforme cloud « comprenne » l'architecture de ses propres puces au niveau le plus bas. Cela permet de distribuer dynamiquement la charge entre des milliers de nœuds avec une latence minimale. Si auparavant les entreprises devaient adapter leurs algorithmes à l'architecture de fournisseurs tiers, maintenant elles dictent elles-mêmes les règles du jeu, créant du matériel pour répondre aux besoins de leurs services.

La composition est complétée par la famille de modèles Tongyi Qianwen. C'est là que réside la principale raison économique de toute l'entreprise. L'entraînement et, ce qui est plus important, l'inférence (exécution) de modèles énormes coûte des sommes astronomiques. En utilisant la combinaison « puce propre + cloud propre + modèle propre, » Alibaba peut réduire radicalement le coût par token pour l'utilisateur final. Tandis que les concurrents sont obligés d'inclure le coût de location de ressources externes et les marges des fabricants de puces dans leurs prix, Alibaba contrôle toute la chaîne de valeur ajoutée. Cela leur donne une marge de manœuvre dans les guerres de prix qui font déjà rage sur le marché de l'IA chinois.

Bien sûr, une question raisonnable se pose : ces puces peuvent-elles vraiment concurrencer les meilleures solutions du « géant vert » ? Une comparaison directe face à face peut ne pas favoriser les ingénieurs chinois si vous ne regardez que les téraflops. Cependant, dans les tâches commerciales réelles, ce qui compte n'est pas la puissance maximale, mais le rapport de performance par watt et, plus important encore, par dollar. L'intégration verticale permet à Alibaba de compenser le déficit de puissance brute grâce à un alignement parfait du logiciel avec le matériel. C'est l'approche classique d'Apple, mise à l'échelle des centres de données et des réseaux de neurones.

Qu'est-ce que cela signifie pour le reste du monde ? Nous assistons à la naissance de deux univers d'IA parallèles. L'un est construit sur l'universalité et la domination de quelques fournisseurs mondiaux de matériel, l'autre sur la spécialisation profonde et les écosystèmes fermés. L'expérience d'Alibaba montre que survivre sous des contraintes force les entreprises à devenir plus intelligentes et plus inventives. Si le « triangle d'or » fonctionne comme prévu, nous verrons un fournisseur de cloud pratiquement impossible à chasser du marché par dumping de prix, car ses coûts d'infrastructure seront d'un ordre de grandeur inférieur à celui de quiconque achète des solutions clés en main.

Le point clé : L'intégration verticale devient le seul moyen de survivre dans la course à l'IA quand le matériel est rare. Quelqu'un en Occident, à part Google avec son TPU, sera-t-il capable de répéter ce chemin à cette échelle ?

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…