DeepSeek reduz preços de V4-Pro em 75% e barateia cache em dez vezes em toda sua API
DeepSeek intensificou a guerra de preços no mercado de API de IA. A empresa reduziu temporariamente os preços do V4-Pro em 75% até 5 de maio de 2026 e…
Processado por IA de TNW; editado por Hamidun News
A DeepSeek intensificou drasticamente sua guerra de preços no mercado de APIs de IA: a empresa anunciou um desconto temporário de 75% no modelo DeepSeek-V4-Pro e simultaneamente reduziu em dez vezes o custo de acertos de cache em toda a linha de APIs. Para os desenvolvedores, esta não é simplesmente uma promoção válida até 5 de maio de 2026, mas uma tentativa de tornar a transição para o modelo chinês quase indolor financeiramente, mesmo para equipes que já trabalham com OpenAI, Anthropic ou Google.
De acordo com a tabela de preços atual da DeepSeek, a taxa padrão para V4-Pro é $1,74 por milhão de tokens de entrada em cache miss, $0,0145 por milhão de tokens de entrada em cache e $3,48 por milhão de tokens de saída. A promoção temporária, válida até 5 de maio de 2026, 15:59 UTC, reduz esses valores para $0,435, $0,003625 e $0,87 respectivamente. Em paralelo, a empresa atualizou as regras de cache para toda a linha de APIs: o preço de um acerto de cache agora representa um décimo do nível de lançamento original. Para agentes em produção, isso é particularmente importante porque reutilizam continuamente as mesmas instruções de sistema, prefixos longos e fragmentos de contexto.
Esse movimento parece estratégico em vez de meramente impulsionado por marketing. A DeepSeek há muito pressiona o mercado sobre preço, especialmente após o lançamento de R1 em janeiro de 2025, quando ficou claro que a empresa chinesa estava disposta a competir não apenas em qualidade, mas também no custo de inferência. Agora a aposta é ainda maior: V4-Pro foi lançado em 24 de abril de 2026, e em 27 de abril, a empresa anunciou preços agressivos de API.
Diante desse cenário, a oferta parece um desafio direto aos provedores americanos, que nos últimos meses têm gradualmente reduzido preços, mas não de forma tão drástica. O pano de fundo político adiciona um efeito adicional: a administração de Donald Trump está simultaneamente acusando empresas chinesas de IA de distilação massiva de modelos americanos.
O V4-Pro em si foi projetado para mais do que apenas competição de preços. De acordo com a DeepSeek, é um modelo mixture-of-experts com 1,6 trilhão de parâmetros totais e 49 bilhões de parâmetros ativos por tarefa. Ele suporta uma janela de contexto de 1 milhão de tokens e saída máxima de até 384.
000 tokens, tornando-o notavelmente mais conveniente para documentos longos, bases de código grandes e cenários de agentes multi-etapas. A empresa especificamente enfatiza a compatibilidade da API com formatos familiares de OpenAI e Anthropic, bem como integração nativa com Claude Code, OpenClaw e OpenCode. Isso reduz o custo não apenas do uso, mas também da própria migração: não há necessidade de mudar toda a sua pilha por um novo modelo.
Outra camada importante da história está relacionada à infraestrutura. DeepSeek está promovendo V4 como um modelo otimizado para chips Huawei Ascend 950 chineses e hardware Cambricon, não apenas Nvidia. Para o mercado, isso sinaliza que a competição não é mais apenas entre modelos individuais, mas entre pilhas tecnológicas inteiras: seus próprios aceleradores, sua própria camada de API, suas próprias ferramentas de agentes e sua própria política de preços. Se essa combinação realmente fornecer qualidade estável em contexto longo, a pressão nos fornecedores americanos fechados passará de episódica a sistêmica.
A conclusão é simples: DeepSeek está tentando ganhar não apenas um ciclo de notícias, mas uma fatia do desenvolvimento real. Quando um modelo tem pesos abertos, um milhão de tokens de contexto, compatibilidade com SDKs populares e simultaneamente preços que reduzem drasticamente o custo de solicitações repetitivas, os argumentos para permanecer em uma API mais cara diminuem. Para startups e pequenas equipes, esta é uma chance de lançar produtos de agentes com custo mais baixo, e para grandes players, um lembrete de que a próxima fase da concorrência em IA será determinada não apenas pela qualidade da resposta, mas pelo preço de cada solicitação funcional.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.