Multiverse Computing a lancé une API publique avec des modèles compressés d’OpenAI, Meta et DeepSeek

Q: Quelle est la source ?

Publication originale sur TechCrunch. Hamidun News traite et adapte les contenus avec l'IA.

Q: Quand a-t-il été publié ?

22 avr. 2026. Temps de lecture : 3 min.

Multiverse Computing a lancé une API publique avec des versions compressées de modèles d’OpenAI, Meta, DeepSeek et Mistral AI. La startup espagnole, issue…

Rédaction de Hamidun News

Veille IA · TechCrunch

22 avr. 2026· 2 min

Traité par IA depuis TechCrunch ; édité par Hamidun News

Multiverse Computing a lancé une API publique avec des modèles compressés d’OpenAI, Meta et DeepSeek — Source : TechCrunch. Collage: Hamidun News.

◐ Écouter l'article

Multiverse Computing, une startup espagnole dans le domaine du calcul quantique et de l'optimisation de l'IA, a annoncé le lancement d'une API publique et d'une application de démonstration pour ses modèles de langage comprimés. Le catalogue inclut déjà des versions comprimées de produits phares de quatre grands laboratoires à la fois : OpenAI, Meta, DeepSeek et Mistral AI. C'est le premier pas de l'entreprise vers le marché de masse après plusieurs années de ventes principalement orientées vers les entreprises.

Multiverse Computing a été fondée en 2019 à San Sebastián, en Espagne. L'entreprise s'était initialement spécialisée dans l'application d'algorithmes quantiques pour des problèmes d'optimisation dans le secteur financier — calculs d'assurance, gestion des risques et optimisation de portefeuille. Au fil du temps, il est devenu évident que les méthodes mathématiques de l'arsenal du calcul quantique étaient également applicables à l'optimisation des réseaux de neurones. Cette même observation a conduit à la création d'une nouvelle direction de produit — la compression de grands modèles de langage tout en préservant le maximum de leurs capacités.

Techniquement, la compression des modèles de langage n'est pas une seule méthode, mais toute une classe d'approches. La quantification convertit les poids du réseau de neurones de float32 en int8 ou int4, réduisant l'espace mémoire de 2 à 4 fois avec une perte de précision minimale sur la plupart des tâches. L'élagage supprime les neurones les moins importants et des couches entières du réseau, réduisant la charge de calcul. La distillation de connaissances transfère le comportement d'un grand modèle vers une architecture plus petite, spécialement entraînée. Ensemble, ces techniques permettent de réduire le modèle de 4 à 8 fois tout en préservant 90-95% de qualité sur les tâches typiques.

Pour les entreprises, cela ouvre des possibilités fondamentalement nouvelles : exécuter une inférence LLM complète sur des appareils sans grappes GPU coûteuses — sur des contrôleurs industriels, des équipements médicaux, des serveurs d'entreprise et des appareils mobiles. Dans les secteurs réglementés — santé, finance, secteur public — c'est critiquement important : les données sensibles restent dans le périmètre de l'organisation et ne sont pas transmises à des API cloud externes.

Le lancement d'une API publique change fondamentalement le modèle commercial de Multiverse Computing. Jusqu'à présent, l'entreprise fonctionnait principalement par le biais de ventes directes aux entreprises : négociations longues, projets pilotes, intégrations individuelles avec des clients spécifiques. Une API ouverte place le produit en mode libre-service — un développeur peut s'inscrire et commencer à travailler sans contact avec le département des ventes. L'application de démonstration sert de salle d'exposition de produits : les clients potentiels peuvent évaluer la qualité des modèles comprimés sur des tâches réelles avant de décider d'un achat ou d'une intégration.

L'inclusion de DeepSeek dans le catalogue mérite une attention particulière — un modèle open-source chinois qui est devenu l'un des événements technologiques majeurs du début 2026. L'intérêt pour lui est énorme, mais de nombreuses entreprises occidentales et structures gouvernementales craignent la dépendance vis-à-vis de l'infrastructure chinoise lors de l'utilisation de l'API officielle. Le déploiement local d'une version comprimée via Multiverse Computing résout ce problème : le modèle fonctionne entièrement dans le périmètre corporatif.

La présence de produits de quatre fournisseurs différents dans le catalogue signale également les ambitions de l'entreprise : un positionnement non pas comme un énième laboratoire d'IA, mais comme un fournisseur d'infrastructure agnostique fonctionnant sur tout l'écosystème des grands modèles. Multiverse Computing mise sur une idée simple : les services d'IA cloud répondent à une demande de masse évidente, mais laissent une énorme niche inexploitée — les entreprises et les secteurs entiers qui, pour des raisons réglementaires, techniques ou économiques, ne peuvent ou ne veulent pas dépendre d'APIs externes. Un catalogue public de modèles comprimés réduit pratiquement à zéro les barrières à l'entrée de ce segment.

Si la technologie démontre une qualité suffisante dans des scénarios de production réels, l'entreprise a une chance réelle d'occuper une position stratégiquement importante dans la couche d'infrastructure du marché de l'IA de prochaine génération.

Hamidun News

Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Canal Telegram RSS hamidun.com

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

🎓 Academy — 7 jours gratuits Consultation gratuite