🎧 Startups et investissements : l'essentiel de la semaine
🎧 Podcast thématique Sais-tu, nous avons aujourd'hui une pile géante de nouvelles analyses, des fuites judiciaires et des rapports financiers. Et…
Traité par IA depuis Hamidun News Podcast ; édité par Hamidun News
_Podcast audio — deux présentateurs IA discutent des dernières nouvelles en IA. Transcription complète ci-dessous._
Présentateur A (00:00) : Sais-tu, nous avons aujourd'hui une pile géante de nouvelles analyses, des fuites judiciaires et des rapports financiers. Et franchement, quand j'ai examiné tout cela avant notre analyse approfondie, les cheveux m'en ont dressés sur la tête.
Présentateur B (00:16) : Oui, il y a pas mal de matériel, et les chiffres là-dedans sont, pour dire le moins, anormaux.
Présentateur A (00:21) : Exactement, anormaux. Et notre principal objectif aujourd'hui est d'essayer de comprendre comment le développement de logiciels ordinaires s'est soudainement transformé en une sorte d'industrie lourde, c'est-à-dire un secteur qui exige des capitaux au niveau des États entiers.
Présentateur B (00:43) : Ce changement de paradigme s'est produit littéralement au cours des derniers trimestres. Nous voyons que l'industrie ne finance plus simplement du code abstrait ou, je ne sais pas, des algorithmes dans le vide. La phase actuelle est une course extrêmement agressive pour posséder précisément l'infrastructure physique critique. Et aujourd'hui, nous analyserons justement toute cette chaîne.
Présentateur A (01:07) : Oui, des évaluations complètement folles des startups IA à la construction de véritables usines géantes. Les chiffres que nous allons disséquer aujourd'hui brisent vraiment toute logique financière habituelle. Et je propose de commencer par le secteur logiciel lui-même.
Présentateur B (01:23) : Allons-y. C'est actuellement le plus chaud.
Présentateur A (01:25) : Eh bien, par exemple, de nouvelles données sur Anthropic. Ce sont les gars qui ont créé le réseau de neurones Claude. Ils négocient actuellement pour lever au moins 30 milliards de dollars.
Présentateur B (01:36) : 30 milliards. En espèces ?
Présentateur A (01:38) : Oui. Et la valorisation de l'entreprise dépasse les 900 milliards de dollars. Mais ce qui m'a vraiment choquée, c'est que il y a seulement 3 mois, au premier trimestre, elle a été évaluée à 20 milliards de dollars.
Présentateur B (01:49) : Une croissance de 45 fois en un trimestre.
Présentateur A (01:53) : Une start-up en trois mois est devenue plus précieuse que les plus grandes banques mondiales réunies. Pourquoi ont-ils besoin de 30 milliards de dollars maintenant ?
Présentateur B (02:02) : Eh bien, regarde, il faut comprendre la logique du marché. Les investisseurs n'évaluent pas actuellement les revenus d'Anthropic. Essentiellement, ils achètent la seule alternative viable et indépendante à OpenAI.
Présentateur A (02:13) : C'est-à-dire qu'ils paient une prime de risque ?
Présentateur B (02:15) : Exactement. Mais si l'on regarde l'aspect purement physique du processus, ces 30 milliards ne sont pas un excédent. C'est leur budget de survie pour les dix-huit à trente-six mois à venir au maximum.
Présentateur A (02:27) : Un budget de survie de 30 milliards. Wow !
Présentateur B (02:31) : Oui, parce que l'argent va à la monétisation des puissances de calcul. Ils doivent acheter des centaines de milliers de puces NVIDIA H100. De plus, Anthropic déclare vouloir étendre la fenêtre de contexte de son modèle à plus de 200 000 jetons. Et du point de vue technique, dans l'architecture des transformers, la complexité computationnelle croît quadratiquement par rapport à la longueur du contexte.
Présentateur A (02:56) : Attends, décryptons cela pour clarifier. C'est-à-dire que si nous doublons, disons, le volume de texte que le réseau de neurones peut traiter simultanément, les exigences matérielles ne doublent pas deux fois, mais immédiatement quadruplent.
Présentateur B (03:10) : Tout à fait. Les mathématiques des transformers sont impitoyables. Chaque jeton doit, grosso modo, faire attention à tous les autres jetons. Quand vous avez des centaines de milliers de jetons, le nombre d'opérations mathématiques devient simplement astronomique.
Présentateur A (03:25) : Et on ne peut pas s'en sortir avec des serveurs loués ordinaires ?
Présentateur B (03:28) : 100%. Ils ont besoin de leur propre infrastructure cloud conçue à partir de zéro. Sans cette injection géante de capital de 30 milliards, ils ne pourront pas former la prochaine génération. C'est une course à l'épuisement.
Présentateur A (03:42) : Oui. Et cette course acquiert rapidement une dimension géopolitique. J'ai découvert dans les rapports des données sur la startup chinoise MoonshotAI, qui crée le chatbot Kimi.
Présentateur B (03:55) : Oui-oui, j'ai lu à leur sujet.
Présentateur A (03:56) : Là aussi, les chiffres sont fous - ils ont levé 2 milliards de dollars avec une valorisation de 20 milliards, croissance de près de 7 fois en 16 mois. Mais, tu sais, le plus intéressant, c'est qui donne l'argent ?
Présentateur B (04:09) : La composition des investisseurs.
Présentateur A (04:11) : Exactement. Il y a MateOne, eh bien, un grand service de livraison, d'accord. Mais ensuite China Mobile, un énorme opérateur de télécommunications avec participation d'État, et un fonds d'investissement du conglomérat d'État CATC. Mais admets-le, ce n'est pas du tout comme du capital-risque classique où les fonds de la Silicon Valley siègent. Cela ressemble à un financement direct d'un projet national.
Présentateur B (04:34) : Je dirais que c'est un signal très clair. Pékin façonne littéralement un soi-disant champion national à partir de MoonshotAI. Quand quelqu'un du calibre de China Mobile entre au capital, la startup obtient bien plus qu'un chèque d'un milliard.
Présentateur A (04:48) : Quoi d'autre ?
Présentateur B (04:48) : L'infrastructure. Et l'infrastructure.
Présentateur A (04:51) : Et l'accès sans entrave aux centres de données nationaux, plus des contrats garantis dans le secteur public, et surtout pour l'IA, l'accès à des volumes colossaux de données internes de l'État pour entraîner ses algorithmes.
Présentateur B (05:05) : C'est-à-dire que l'intelligence artificielle a cessé d'être une histoire commerciale ?
Présentateur A (05:09) : Absolument. C'est maintenant une question de sécurité nationale et de souveraineté technologique au plus haut niveau. Et cela explique bien pourquoi les chiffres sont si énormes. Oui, et cette transition de l'IA vers la catégorie des infrastructures lourdes nous ramène à une fuite judiciaire très intéressante dont je voulais parler. Elle concerne Microsoft et OpenAI.
Présentateur B (05:32) : Oh, oui, les coûts cachés.
Présentateur A (05:35) : Oui. Officiellement, tout le monde pensait, enfin c'était annoncé publiquement, que Microsoft avait investi 13 milliards de dollars dans OpenAI. Cela semble beaucoup, mais gérable. Mais les documents judiciaires viennent de révéler la véritable image. Les dépenses réelles du géant logiciel dépasseront 100 milliards de dollars d'ici juin 2026.
Présentateur B (05:57) : Une différence de 7 fois, juste un instant.
Présentateur A (05:59) : La différence est colossale. C'est une chose d'entraîner un modèle en laboratoire, et c'en est une autre de l'intégrer dans le cloud, dans Word, dans Excel et de le forcer à traiter un million de requêtes par seconde. Voici la question qui se pose : si même Microsoft est forcée de cacher les coûts réels de maintien de l'IA, ne signifie-t-il pas que l'IA générative s'est avérée être un luxe trop cher ?
Présentateur B (06:24) : Eh bien, regardez, les documents montrent que chaque requête à ce modèle avancé coûte des dizaines, voire parfois des centaines de fois plus cher qu'une recherche ordinaire.
Présentateur A (06:33) : Des centaines de fois ?
Présentateur B (06:34) : Oui. Vous avez besoin du fonctionnement 24/24 d'énormes clusters de processeurs graphiques. C'est là d'ailleurs que naît la récente restructuration d'OpenAI.
Présentateur A (06:44) : Tu veux dire leur nouveau spin-off ?
Présentateur B (06:45) : Oui, ils créent une structure filiale séparée, une entreprise de déploiement, et jettent immédiatement 4 milliards de dollars dedans.
Présentateur A (06:52) : Oui-oui-oui, j'ai vu cette liste d'investisseurs, 19 sociétés y ont contribué ces 4 milliards, avec TPG, Advent International, Bank Capital, de gros acteurs de l'investissement. Mais une compagnie m'a vraiment marquée. Brookfield.
Présentateur B (07:07) : Oh, Brookfield c'est très révélateur.
Présentateur A (07:09) : Les plus grands gestionnaires d'actifs au monde dans le domaine des infrastructures et de l'énergie. C'est-à-dire qu'ils construisent des centrales électriques, des canalisations d'eau. Et maintenant ils donnent de l'argent pour... Le goulot d'étranglement n'est plus le code, c'est la prise de courant.
Présentateur B (07:24) : Exactement. Le déploiement de modèles IA modernes aujourd'hui est une tâche pour un promoteur industriel, pas pour un programmeur. Pour construire un centre de données, vous ne pouvez pas juste acheter des serveurs. Vous avez besoin de centaines d'hectares de terre.
Présentateur A (07:36) : Et de l'eau, probablement, pour refroidir tout ça.
Présentateur B (07:40) : Oui, des volumes colossaux d'eau qui doivent être coordonnés avec les autorités, et surtout une connexion directe à des lignes haute tension. La Silicon Valley n'a tout simplement pas cette expertise. Mais Brookfield l'a. Cette alliance est une reconnaissance explicite que la technologie s'est heurtée à la limite physique des réseaux énergétiques.
Présentateur A (07:56) : Écoute, puisque les principaux problèmes se sont déplacés vers le monde physique, les prises de courant, le refroidissement, il est logique de regarder le marché du matériel. Des changements tectoniques y surviennent aussi.
Présentateur B (08:08) : Et comment ! Le seul Cerebras vaut quoi ?
Présentateur A (08:11) : Oh oui ! Une valorisation de 95 milliards de dollars. Ils ont levé plus de 5,5 milliards, et le premier jour de cotation, leurs actions ont bondi de 68%. C'est le plus gros placement technologique depuis 2020, quand Snowflake a fait ses débuts.
Présentateur B (08:28) : Et ici, tu sais, l'essentiel n'est même pas les records boursiers. Ce qui importe, c'est pourquoi le marché les évalue ainsi. Ils ont la technologie Wafer Scale. Ils résolvent essentiellement le principal problème des puces modernes - le problème de l'interconnexion.
Présentateur A (08:41) : C'est-à-dire le retard physique, quand les données circulent entre différents
Présentateur B (08:45) : processeurs ? Oui, exactement.
Présentateur A (08:47) : J'ai pensé à une analogie pour mieux le visualiser. Voilà, les puces traditionnelles dans un superordinateur ressemblent à un tas de petits villages. Et pour qu'ils résolvent une tâche commune, il faut construire des châssis coûteux et des câbles entre eux.
Présentateur B (09:00) : Et faire circuler des camions de données d'avant en arrière.
Présentateur A (09:03) : Oui-oui, beaucoup de temps et d'énergie sont dépensés juste pour la logistique. Et la puce Wafer Scale de Cerebras, elle a la taille d'une wafer de silicium entière. C'est comme construire une méga-métropole sur une seule fondation. Tout est à proximité, pas de câbles externes, et au final 40% de plus de noyaux de calcul pour la même surface.
Présentateur B (09:25) : Excellente analogie. Et la physique du processus détermine l'économie. À l'intérieur d'un cristal, les signaux se propagent ordres de grandeur plus rapidement, et surtout nécessitent bien moins d'énergie que quand le signal sort vers la carte mère. L'entraînement d'un énorme réseau de neurones exige que tous les noyaux fonctionnent en synchronisation. En supprimant la distance physique, vous réduisez dramatiquement le temps d'entraînement.
Présentateur B (09:50) : Pour des géants comme Meta ou Google, réduire l'entraînement d'un modèle de plusieurs mois à quelques semaines est un avantage critique. Ils paieraient n'importe quoi pour cela.
Présentateur A (10:01) : Mais regardez, Cerebras résout le problème de la vitesse. Il y a aussi la nouvelle sur la compagnie ARM, qui vise une autre cible, l'efficacité énergétique.
Présentateur B (10:12) : Oui, ARM aussi est un sujet très important.
Présentateur A (10:15) : Leur PDG Rene Haas a récemment annoncé une sorte d'explosion de la demande. En 5 semaines, ils ont reçu des commandes pour 2 milliards de dollars. C'est deux fois leur normale. Et ARM a toujours été associée aux smartphones, alors que maintenant cette croissance vient précisément des centres de données.
Présentateur B (10:33) : Parce que les centres de données fuient massivement les processeurs x86 classiques d'Intel et AMD. Pourquoi ? Ils consomment trop d'énergie.
Présentateur A (10:42) : Exactement. L'architecture x86 a dominé pendant des décennies, mais elle a été créée comme universelle, avec beaucoup d'instructions obsolètes. C'est une architecture CISC, un ensemble complexe d'instructions.
Présentateur B (10:54) : D'accord.
Présentateur A (10:55) : Et ARM utilise RISC, un ensemble réduit. C'est-à-dire que la puce n'exécute que les instructions de base, mais les exécute super efficacement. Au final, les centres de données économisent 30-40% d'énergie. Pas mal ! Mais à l'échelle d'un ordinateur portable, 40% d'économie, c'est juste une heure supplémentaire de séries.
Présentateur A (11:14) : Mais dans un centre de données
Présentateur B (11:15) : Oui, dans un centre de données avec des centaines de milliers de serveurs, c'est des centaines de mégawatts. C'est des centaines de millions de dollars de profit opérationnel net chaque année.
Présentateur A (11:24) : Et moins de chaleur, probablement ? C'est-à-dire moins de dépenses en refroidissement ?
Présentateur B (11:28) : 100%. Moins d'électricité pour les serveurs, moins d'électricité pour les climatiseurs. Réaction en chaîne. C'est pourquoi le marché mobile stagne actuellement, et le segment des serveurs deviendra le principal moteur de croissance pour ARM d'ici 2026-2027. Les fournisseurs de cloud n'ont tout simplement nulle part où aller, ils ont des limites strictes de dissipation thermique par mètre carré.
Présentateur A (11:46) : mètre. Oui, si vous ne pouvez pas apporter plus de courant au bâtiment, il ne reste que d'installer des puces qui font plus de travail par Watt. Logique ?
Présentateur B (11:54) : Exactement.
Présentateur A (11:55) : Mais tu sais, si les puces sont devenues la ressource la plus précieuse sur la planète, de laquelle dépend la survie des entreprises, se fier à quelqu'un d'extérieur devient trop risqué.
Présentateur B (12:04) : Tu en viens à la nouvelle sur SpaceX ?
Présentateur A (12:08) : Oui. C'est juste révolutionnaire. SpaceX investit au minimum 55 milliards de dollars avec un potentiel jusqu'à 119 milliards dans une usine de puces IA au Texas. Le projet s'appelle TerraFab.
Présentateur B (12:22) : Les chiffres sont fous, je suis d'accord.
Présentateur A (12:24) : Pour le contexte, j'ai vérifié que le budget annuel de l'agence spatiale NASA est d'environ 25 milliards. C'est-à-dire que la compagnie spatiale d'Elon Musk prévoit de déverser presque 5 budgets de la NASA dans une usine terrestre de production de microprocesseurs.
Présentateur B (12:38) : Pour produire des processeurs avec 200 GW de puissance de calcul par an.
Présentateur A (12:43) : Pourquoi ? Une compagnie spatiale devrait construire des fusées, ou au pire des satellites, pas concurrencer les usines asiatiques pour la fusion du silicium.
Présentateur B (12:52) : Eh bien, ici il faut regarder tout l'Empire Musk dans son ensemble. Il n'y a pas que SpaceX, il y a xAI, il y a Tesla avec ses pilotes automatiques. Tous ces projets ont besoin de manière critique de dizaines de milliers de GPU.
Présentateur A (13:04) : Et il ne veut pas faire la queue chez NVIDIA.
Présentateur B (13:07) : Il y a le monopole de NVIDIA sur la conception et de TSMC sur la production. Musk ne veut pas payer la marge de NVIDIA de 70-80% et attendre les quotas.
Présentateur A (13:18) : C'est-à-dire que c'est simplement une intégration verticale dure. Tu veux une IA puissante, fabrique ton propre silicium.
Présentateur B (13:24) : Oui. Mais tu ne peux pas justifier 119 milliards d'économies sur les marges. C'est 100% de la géopolitique.
Présentateur A (13:32) : Un bouclier contre les guerres commerciales.
Présentateur B (13:34) : Exactement. Une usine au Texas, c'est l'indépendance totale de tout blocage dans la région du Pacifique ou de conflits. Cela rend l'Empire Musk complètement autonome.
Présentateur A (13:44) : Et crée un nouveau centre de gravité dans l'industrie en dehors des anciennes chaînes d'approvisionnement. Mais écoute, j'ai une question très pragmatique - nous discutons 100 milliards de Microsoft, 30 milliards d'Anthropic, l'usine de Musk pour 119 milliards, c'est déjà environ 250 milliards de dollars qui sont simplement enfouis dans les fondations de l'IA.
Présentateur B (14:06) : Alors, et quel est
Présentateur A (14:06) : la question ? Qui paie la note ? Où le business voit-il le retour sur ces investissements géants ?
Présentateur B (14:14) : Et c'est ici qu'un rapport d'analystes de Bainin Company peut nous aider.
Présentateur A (14:18) : Exactement, je l'ai lu. Ils évaluent le futur marché du logiciel d'entreprise basé sur ce qu'on appelle l'IA d'agents à 100 milliards de dollars.
Présentateur B (14:28) : Et le mot-clé ici est "agent". Nous ne parlons plus de chatbots qui écrivent simplement du texte ou du code sur
Présentateur A (14:35) : demande. Oui, c'est l'automatisation, les travaux de coordination. Cela semble bien sûr super ennuyeux. Saisie de données, échange d'informations dans les systèmes ERP et CRM, logistique.
Présentateur B (14:47) : Cela semble ennuyeux, mais c'est un milliard de dollars pour les corporations.
Présentateur A (14:51) : C'est-à-dire attends, nous construisons vraiment des usines de 200 gigawatts et brûlons l'électricité de centrales entières juste pour qu'un agent-robot puisse remplir un ennuyeux bon de livraison dans
Présentateur B (15:02) : la comptabilité ? Oui, imagine. Parce que la routine de coordination est un énorme impôt caché sur l'économie. Un million de managers travaillent juste comme des routeurs vivants, copient les données d'un programme incompatible à un autre, attendent les approbations.
Présentateur A (15:18) : C'est vrai, oui.
Présentateur B (15:19) : L'IA d'agent se connecte elle-même au système d'entrepôt, vérifie elle-même les réductions dans le CRM, rédige elle-même le rapport et l'envoie au client. Cela élimine la friction dans les processus métier.
Présentateur A (15:29) : Et libère les gens pour le vrai travail, l'analyse, la stratégie, la communication avec les clients. Essentiellement, c'est une refonte complète de tout le logiciel d'entreprise pour les 5-10 prochaines années.
Présentateur B (15:43) : Et le business est prêt à payer n'importe quel prix pour les licenses. Chaque heure économisée par les companies se convertira directement en frais de puissance de calcul. C'est un modèle économique absolument fermé.
Présentateur A (15:55) : Fenêtres contextuelles et valorisations de billions de dollars.
Présentateur B (15:58) : Et nous finissons avec du béton et des prises.
Présentateur A (16:01) : Exactement. Il s'avère que toute cette industrie apparemment éphémère bute contre la physique. Les wafers de silicium de la taille d'une assiette, les usines géantes de Musk, les noyaux économes en énergie - les startups se sont transformées sous nos yeux en une véritable industrie lourde du 21e siècle, les règles de la Silicon Valley ne fonctionnent plus.
Présentateur B (16:22) : Oui, l'ampleur du capital est devenue le principal filtre. Sans connexions dans l'énergie mondiale et la construction industrielle, il n'y a plus rien à faire en IA.
Présentateur A (16:30) : Écoute, et puisque nous parlons d'énergie, j'ai une pensée à la fin, une pensée provocante, qui n'était pas directement dans ces rapports.
Présentateur B (16:38) : Intéressant. Partage.
Présentateur A (16:40) : Regarde. Si SpaceX a besoin de 200 GW, si ARM se bat jusqu'à la mort pour chaque 10% d'économie de Watts dans les data-centers, et si dans les 10 prochaines années le principal goulot d'étranglement n'était pas la pénurie de puces ou d'argent des investisseurs ? Juste ? Une simple pénurie de capacités des réseaux électriques mondiaux. Il n'y aura tout simplement pas assez de bande passante.
Présentateur A (17:04) : Les géants technologiques de demain ne devront-ils pas devenir les plus grandes compagnies d'énergie du monde ? Construire leurs propres centrales nucléaires, juste pour que leurs algorithmes ne s'éteignent pas par manque d'électricité ?
Présentateur B (17:15) : C'est une question très puissante. Et à en juger par les deals avec Brookfield, ils ont déjà commencé à le faire.
Présentateur A (17:20) : Exactement. Laissons cette pensée pour la réflexion. Notre analyse approfondie se termine ici. Jusqu'aux prochaines immersions dans les données.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.