TNW→ original

DeepSeek réduit les prix de V4-Pro de 75% et divise par dix les coûts du cache sur toute son API

DeepSeek a intensifié la guerre des prix sur le marché des API d'IA. L'entreprise a temporairement réduit les prix de V4-Pro de 75% jusqu'au 5 mai 2026 et a…

Traité par IA depuis TNW ; édité par Hamidun News
DeepSeek réduit les prix de V4-Pro de 75% et divise par dix les coûts du cache sur toute son API
Source : TNW. Collage: Hamidun News.
◐ Écouter l'article

DeepSeek a intensifié de manière drastique sa guerre des prix sur le marché des API d'IA : l'entreprise a annoncé une réduction temporaire de 75% sur le modèle DeepSeek-V4-Pro et a simultanément réduit d'un facteur dix le coût des accès au cache sur toute la gamme d'API. Pour les développeurs, ce n'est pas simplement une promotion valable jusqu'au 5 mai 2026, mais une tentative de rendre la transition vers le modèle chinois quasi indolore financièrement, même pour les équipes travaillant déjà avec OpenAI, Anthropic ou Google.

Selon la table de tarification actuelle de DeepSeek, le tarif standard pour V4-Pro est de 1,74 $ par million de jetons d'entrée en cache miss, 0,0145 $ par million de jetons d'entrée en cache et 3,48 $ par million de jetons de sortie. La promotion temporaire, valable jusqu'au 5 mai 2026, 15:59 UTC, réduit ces valeurs à 0,435 $, 0,003625 $ et 0,87 $ respectivement. En parallèle, l'entreprise a mis à jour les règles de cache pour toute la gamme d'API : le prix d'un accès au cache représente désormais un dixième du niveau de lancement initial.

Pour les agents en production, c'est particulièrement important car ils réutilisent continuellement les mêmes instructions système, les longs préfixes et les fragments de contexte.

Ce mouvement semble stratégique plutôt que simplement motivé par le marketing. DeepSeek exerce depuis longtemps une pression sur le marché en termes de prix, en particulier après le lancement de R1 en janvier 2025, quand il est devenu clair que l'entreprise chinoise était disposée à concurrencer non seulement sur la qualité mais aussi sur le coût d'inférence. Maintenant l'enjeu est encore plus élevé : V4-Pro a été lancé le 24 avril 2026, et dès le 27 avril, l'entreprise a annoncé une tarification API agressive.

Dans ce contexte, l'offre semble constituer un défi direct aux fournisseurs américains, qui ces derniers mois ont eux-mêmes réduit progressivement les prix, mais pas de manière aussi drastique. Le contexte politique ajoute un effet supplémentaire : l'administration de Donald Trump accuse simultanément les entreprises d'IA chinoises de distillation massive des modèles américains.

V4-Pro lui-même est conçu pour plus qu'une simple concurrence sur les prix. Selon DeepSeek, c'est un modèle mixture-of-experts avec 1,6 trillion de paramètres totaux et 49 milliards de paramètres actifs par tâche. Il supporte une fenêtre de contexte d'1 million de jetons et une sortie maximale jusqu'à 384 000 jetons, ce qui le rend notablement plus pratique pour les longs documents, les grandes bases de code et les scénarios d'agents multi-étapes.

L'entreprise souligne spécifiquement la compatibilité de l'API avec les formats familiers d'OpenAI et d'Anthropic, ainsi que l'intégration native avec Claude Code, OpenClaw et OpenCode. Cela réduit le coût non seulement de l'utilisation mais aussi de la migration elle-même : il n'est pas nécessaire de changer toute votre pile pour un nouveau modèle.

Une autre couche importante de l'histoire concerne l'infrastructure. DeepSeek promeut V4 comme un modèle optimisé pour les puces chinoises Huawei Ascend 950 et le matériel Cambricon, pas seulement Nvidia. Pour le marché, cela signale que la concurrence n'est plus simplement entre des modèles individuels, mais entre des piles technologiques entières : leurs propres accélérateurs, leur propre couche d'API, leurs propres outils d'agents et leur propre politique de tarification. Si une telle combinaison fournit vraiment une qualité stable sur un contexte long, la pression sur les fournisseurs américains fermés passera d'épisodique à systémique.

La conclusion est simple : DeepSeek essaie de remporter non pas seulement un cycle de nouvelles mais une part du développement réel. Lorsqu'un modèle a des poids ouverts, un million de jetons de contexte, une compatibilité avec les kits de développement populaires et simultanément une tarification qui réduit considérablement le coût des requêtes répétitives, les arguments pour rester sur une API plus coûteuse diminuent. Pour les startups et les petites équipes, c'est une chance de lancer des produits d'agents à moindre coût, et pour les grands acteurs, un rappel que la prochaine phase de concurrence en IA sera déterminée non seulement par la qualité des réponses mais par le prix de chaque requête fonctionnelle.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…