Jiqizhixin (机器之心)→ original

Tokens à la chinoise : Comment économiser 50% sur l'API quand le marché a grandi 300 fois

Tandis que le monde surveille la prochaine mise à jour de GPT, la Chine connaît une révolution silencieuse mais extrêmement coûteuse. Au cours des dix-huit…

Traité par IA depuis Jiqizhixin (机器之心) ; édité par Hamidun News
Tokens à la chinoise : Comment économiser 50% sur l'API quand le marché a grandi 300 fois
Source : Jiqizhixin (机器之心). Collage: Hamidun News.
◐ Écouter l'article

Tandis que le monde surveille la prochaine mise à jour de GPT, la Chine connaît une révolution silencieuse mais extrêmement coûteuse. Au cours des dix-huit derniers mois, la consommation de tokens en Chine a augmenté de manière incroyable 300 fois. Ce n'est pas simplement des statistiques — c'est une explosion qui a exposé le principal problème de l'industrie : l'intelligence artificielle coûte indécemment cher aujourd'hui.

Si vous pensiez que les factures d'informatique en nuage font mal, imaginez l'ampleur du désastre pour les entreprises essayant d'intégrer des réseaux de neurones dans chaque processus métier. La situation a atteint un point où même les géants technologiques se demandent si ces dépenses sont justifiées. Rappelons-nous comment nous sommes arrivés là.

Il y a un an et demi, le marché chinois de l'IA en était au stade de la "guerre des cent modèles". Chaque géant technologique qui se respecte se sentait obligé de lancer son propre LLM. Dans la course à la qualité des réponses et à la précision, tout le monde a oublié l'économie.

Au final, nous avons obtenu un marché où la demande de calcul augmente exponentiellement, tandis que les marges commerciales tendent vers zéro. Le classique modèle de "brûler de l'argent" qui fonctionnait à l'époque d'Uber et de la livraison de nourriture échoue ici en raison du coût colossal des heures de GPU et de la maintenance de l'infrastructure. L'aide est venue d'une équipe de l'Université de Tsinghua — le principal vivier de talents pour l'industrie de la haute technologie chinoise.

Une nouvelle vague de startups spécialisées dans l'infrastructure d'IA a décidé d'aborder le problème non pas du côté de l'entraînement des modèles, mais du côté de leur exploitation. Ils prétendent qu'ils peuvent réduire les dépenses d'API de moitié. Cela ressemble à un slogan publicitaire, mais il y a derrière un travail d'ingénierie sérieux.

Il s'agit de l'optimisation profonde de la planification des ressources, de la mise en cache intelligente et de ce que l'industrie appelle la co-conception du logiciel et du matériel. Ils ne louent pas simplement des serveurs — ils reconstruisent la façon dont le modèle communique avec le matériel. Pourquoi est-ce important maintenant ?

Parce que le marché passe de l'émerveillement au pragmatisme. Les investisseurs ne sont plus disposés à signer des chèques simplement pour la présence de lettres "IA" dans une présentation. Ils ont besoin de chiffres de ROI.

Si une startup dépense 80 % de ses revenus en paiements d'API à OpenAI ou au Baidu local, elle n'a pas d'avenir. Les solutions d'optimisation de l'infrastructure deviennent cette "sauce secrète" qui permettra à l'IA de sortir des laboratoires et des jouets coûteux pour les geeks vers l'économie réelle — de la manufacture au commerce de détail. Intéressamment, cette tendance de "l'IA frugale" est née en Chine précisément à cause de pénuries de puces et des restrictions liées aux sanctions.

Quand vous n'avez pas un accès illimité aux derniers H100, vous commencez à réfléchir à la façon de tirer le maximum de ce que vous avez. En ce sens, les ingénieurs chinois sont actuellement à l'avant-garde de l'optimisation. Ils apprennent à faire plus avec moins, et cette expérience sera bientôt demandée dans le monde entier.

Après tout, en fin de compte, ce n'est pas celui qui a un modèle 1 % plus intelligent qui gagnera, mais celui qui peut fournir cette intelligence à un prix qui ne ruinera pas le client. L'essentiel : l'ère de l'excès en IA touche à sa fin. L'époque des ingénieurs en infrastructure arrive — ceux qui rendront les réseaux de neurones véritablement bon marché.

Les entreprises occidentales pourront-elles concourir sur l'efficacité si les coûts des tokens en Chine continuent de baisser à ce rythme ?

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…