DeepSeek reduce precios de V4-Pro en 75% y reduce costos de caché diez veces en toda su API
DeepSeek ha intensificado la guerra de precios en el mercado de API de IA. La empresa redujo temporalmente los precios de V4-Pro en 75% hasta el 5 de mayo de…
Procesado por IA desde TNW; editado por Hamidun News
DeepSeek ha intensificado drásticamente su guerra de precios en el mercado de APIs de IA: la empresa anunció un descuento temporal del 75% en el modelo DeepSeek-V4-Pro y simultáneamente redujo en diez veces el costo de aciertos de caché en toda la línea de APIs. Para los desarrolladores, esta no es simplemente una promoción válida hasta el 5 de mayo de 2026, sino un intento de hacer la transición al modelo chino casi indolora financieramente, incluso para equipos que ya trabajan con OpenAI, Anthropic o Google.
Según la tabla de precios actual de DeepSeek, la tarifa estándar para V4-Pro es de $1,74 por millón de tokens de entrada en cache miss, $0,0145 por millón de tokens de entrada en caché y $3,48 por millón de tokens de salida. La promoción temporal, válida hasta el 5 de mayo de 2026, 15:59 UTC, reduce estos valores a $0,435, $0,003625 y $0,87 respectivamente. En paralelo, la empresa actualizó las reglas de cache para toda la línea de APIs: el precio de un acierto de caché ahora representa una décima parte del nivel de lanzamiento original. Para agentes en producción, esto es particularmente importante porque reutilizan continuamente las mismas instrucciones del sistema, prefijos largos y fragmentos de contexto.
Este movimiento se ve estratégico en lugar de meramente impulsado por marketing. DeepSeek ha presionado durante mucho tiempo el mercado en precio, especialmente después del lanzamiento de R1 en enero de 2025, cuando quedó claro que la empresa china estaba dispuesta a competir no solo en calidad sino también en el costo de inferencia. Ahora la apuesta es aún mayor: V4-Pro se lanzó el 24 de abril de 2026, y el 27 de abril, la empresa anunció precios agresivos de API.
Ante este panorama, la oferta parece un desafío directo a los proveedores estadounidenses, que en los últimos meses han ido reduciendo gradualmente los precios, pero no de manera tan drástica. El contexto político añade un efecto adicional: la administración de Donald Trump está acusando simultáneamente a las empresas de IA chinas de distilación masiva de modelos estadounidenses.
El V4-Pro en sí está diseñado para más que solo competencia de precios. Según DeepSeek, es un modelo mixture-of-experts con 1,6 billones de parámetros totales y 49 mil millones de parámetros activos por tarea. Admite una ventana de contexto de 1 millón de tokens y una salida máxima de hasta 384.
000 tokens, lo que lo hace notablemente más conveniente para documentos largos, grandes bases de código y escenarios de agentes de múltiples pasos. La empresa específicamente enfatiza la compatibilidad de la API con formatos familiares de OpenAI y Anthropic, así como la integración nativa con Claude Code, OpenClaw y OpenCode. Esto reduce el costo no solo del uso sino también de la migración misma: no es necesario cambiar toda su pila por un nuevo modelo.
Otra capa importante de la historia se relaciona con la infraestructura. DeepSeek está promoviendo V4 como un modelo optimizado para chips Huawei Ascend 950 chinos y hardware Cambricon, no solo Nvidia. Para el mercado, esto señala que la competencia ya no es solo entre modelos individuales, sino entre pilas tecnológicas completas: sus propios aceleradores, su propia capa de API, sus propias herramientas de agentes y su propia política de precios. Si tal combinación realmente proporciona calidad estable en contexto largo, la presión sobre los proveedores americanos cerrados pasará de episódica a sistémica.
La conclusión es simple: DeepSeek está tratando de ganar no solo un ciclo de noticias sino una participación en el desarrollo real. Cuando un modelo tiene pesos abiertos, un millón de tokens de contexto, compatibilidad con SDKs populares y simultáneamente precios que reducen drásticamente el costo de solicitudes repetitivas, los argumentos para permanecer en una API más cara disminuyen. Para startups y equipos pequeños, esta es una oportunidad de lanzar productos de agentes a menor costo, y para grandes jugadores, un recordatorio de que la próxima fase de competencia en IA será determinada no solo por la calidad de la respuesta sino por el precio de cada solicitud funcional.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.