TechCrunch→ original

Gimlet Labs lève $80M pour une exécution unifiée de l'inférence IA sur les puces NVIDIA, AMD, Intel et autres

La startup Gimlet Labs a clôturé une levée de Série A de $80M. L'entreprise a créé une couche logicielle permettant d'exécuter l'inférence IA simultanément…

Traité par IA depuis TechCrunch ; édité par Hamidun News
Gimlet Labs lève $80M pour une exécution unifiée de l'inférence IA sur les puces NVIDIA, AMD, Intel et autres
Source : TechCrunch. Collage: Hamidun News.
◐ Écouter l'article

Gimlet Labs a levé $80 millions lors d'un tour de financement de série A pour développer une technologie qui résout l'un des principaux problèmes de l'IA moderne — la dépendance des modèles au matériel spécifique. L'entreprise a créé une couche logicielle qui permet d'exécuter l'inférence de réseaux de neurones simultanément sur des puces de six fabricants : NVIDIA, AMD, Intel, ARM, Cerebras et d-Matrix. Le problème que résout Gimlet Labs est bien connu de tous ceux qui ont déployé l'IA en production.

Chaque fabricant de puces fournit son propre stack logiciel — CUDA pour NVIDIA, ROCm pour AMD, oneAPI pour Intel. Passer d'un matériel à un autre nécessite de réécrire du code, de tester et un débogage prolongé. Les entreprises se retrouvent prisonnières des fournisseurs : même si AMD offre un meilleur prix ou Cerebras offre de meilleures performances pour une tâche spécifique, la migration est trop coûteuse.

Gimlet Labs propose une API unifiée pour toutes les plates-formes supportées. Essentiellement, il s'agit d'une couche d'abstraction entre le modèle et le matériel — analogue à ce que POSIX a fait pour les systèmes d'exploitation. Un développeur écrit le code une fois, et la plate-forme optimise automatiquement l'exécution pour le matériel disponible.

L'inclusion de d-Matrix et Cerebras dans la liste est particulièrement significative — des acteurs de niche spécialisés dans l'inférence. Cela envoie un signal au marché : Gimlet Labs ne se limite pas au courant dominant. $80 millions représentent un pari sérieux que le problème de la fragmentation du marché des puces ne se résoudra pas de lui-même.

Les investisseurs croient clairement que les fabricants de matériel ne parviendront pas à un accord entre eux, ce qui signifie que le marché a vraiment besoin d'une couche d'abstraction neutre à long terme. Le tour de financement souligne que le niveau d'infrastructure de la pile IA devient aussi stratégiquement important que les modèles eux-mêmes. Pour les acheteurs corporatifs d'IA, cette technologie signifie un vrai pouvoir de négociation.

Aujourd'hui, une énorme part des dépenses en infrastructure IA va à NVIDIA — non pas parce que les alternatives n'existent pas, mais parce que le changement est trop douloureux. Si Gimlet Labs réduit vraiment le coût de la migration à des niveaux acceptables, les entreprises gagnent un levier : elles peuvent acheter auprès de celui qui offre le meilleur prix à tout moment, plutôt que d'être attachées à celui auquel leur base de code est déjà liée. L'élégance de la solution ne réside pas dans l'idée de la couche d'abstraction elle-même (elle est bien connue depuis longtemps), mais dans le fait que l'équipe a réussi à l'implémenter sans perte catastrophique de performance.

C'est généralement là que des projets similaires échouent : l'universalité n'ira pas bien avec l'optimisation. La façon dont Gimlet Labs a géré cette contradiction sera révélée en production.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…