Les entreprises d'IA n'augmentent pas les prix pour les utilisateurs tandis que Nvidia et Micron engrangent des profits record
Nvidia et Micron Technology battent des records de bénéfices sur la vague du boom de l'IA, et la pénurie de mémoire pour les réseaux neuronaux persistera au…
Traité par IA depuis 3DNews AI ; édité par Hamidun News
Les producteurs de puces et de mémoire d'IA enregistrent des profits record dans le contexte du boom de l'IA générative. Mais les entreprises qui développent les modèles eux-mêmes ne se pressent pas encore de répercuter les coûts d'infrastructure croissants sur les utilisateurs finaux — et cela change toute la logique de tarification de l'industrie.
Profits extraordinaires des fournisseurs de matériel
Pendant plusieurs trimestres consécutifs, Nvidia a démontré des marges atypiques même pour les meilleures périodes de l'industrie des semi-conducteurs. Maintenant, les fabricants de mémoire les ont rejoints. Micron Technology affiche des résultats comparables face à la demande croissante de HBM (High Bandwidth Memory) — mémoire spécialisée pour les accélérateurs d'IA. SK Hynix, Samsung et Micron réunis ne parviennent pas à augmenter la production de HBM plus vite que la demande des data centers ne croît. Les analystes prédisent que la pénurie persistera au moins jusqu'à la fin de 2026. Cela signifie : les prix des composants resteront élevés et les marges des fournisseurs continueront à croître.
- HBM3E — un composant clé pour les GPU de prochaine génération (Nvidia H200, B200)
- Les prix du HBM ont plus que doublé au cours des deux dernières années
- La capacité de production s'étend, mais le retard par rapport à la demande persiste
- La pénurie est prévue pour toute l'année 2025–2026
- De nouveaux acteurs (Broadcom, Marvell) entrent dans le segment, mais ne changent pour l'instant pas la situation
Les investisseurs, non les utilisateurs, comblent l'écart
Malgré l'augmentation des coûts, les principaux développeurs de modèles d'IA maintiennent ou réduisent généralement les coûts d'accès par API. La concurrence à ce niveau est tellement intense que répercuter ouvertement les coûts sur les clients est risqué : une entreprise perdra simplement des parts de marché face à un concurrent moins cher. Les dépenses d'infrastructure sont actuellement couvertes par trois facteurs.
Premièrement — optimisation des modèles : des architectures plus efficaces réduisent les coûts d'inférence. Deuxièmement — économies d'échelle : plus le nombre de requêtes passant par un seul cluster est élevé, plus le coût unitaire est faible. Troisièmement — subvention du capital-risque : les investisseurs versent des milliards en prévision d'une monétisation future, couvrant les pertes actuelles.
OpenAI, selon les estimations des analystes, opère toujours à perte au niveau des dépenses opérationnelles. Anthropic reçoit des investissements d'Amazon et Google qui subventionnent effectivement l'accès des développeurs aux modèles. Cela crée des prix artificiellement bas sur le marché qui ne reflètent pas le coût réel du calcul.
Qui paie finalement
La chaîne de valeur dans l'industrie de l'IA fonctionne aujourd'hui de manière paradoxale : les fabricants de matériel gagnent, les développeurs de modèles opèrent à perte ou à l'équilibre, les utilisateurs finaux reçoivent des services à des prix subventionnés. La question est de savoir combien de temps cela peut durer.
Avec la consolidation du marché — quand 2–3 grands acteurs survivront — la guerre des prix s'apaisera et les coûts des services commenceront à augmenter. Avec une percée technologique, les coûts diminueront naturellement. Si les grands clients d'entreprise commencent à passer à leurs propres modèles et infrastructure — cela changera tout l'équilibre des forces.
Pour l'instant, le capital-risque paie le « banquet », mais sa patience n'est pas infinie.
Ce que cela signifie
La situation tarifaire actuelle profite à tous ceux qui construisent des produits basés sur l'IA en ce moment : les coûts des API sont historiquement bas par rapport au coût réel du calcul. Pour les affaires, c'est une fenêtre d'opportunité — tant que le marché subventionne l'infrastructure, il est judicieux de maximiser les compétences et les produits basés sur l'IA. Une réévaluation est inévitable — c'est juste une question de délais.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.
L'essentiel de l'IA — une fois par semaine
Sept actus qui ont vraiment compté, choisies à la main. Sans bruit ni communiqués.
C'est fait ! Vérifiez votre boîte mail pour la confirmation.