DeepSeek reduz preços da API V4-Pro em 75% e corta taxas de cache para um décimo

Pontos principais
- A DeepSeek oferece um desconto promocional de 75% em seu modelo V4-Pro até 5 de maio de 2026.
- As taxas de cache-hit em toda a API são reduzidas para 10% das taxas anteriores.
- Ao preço cheio, o V4-Pro custa $0,145 por milhão de tokens de entrada, já mais barato do que a GPT-5.5, a Gemini 3.1 Pro e a Claude Opus 4.7.
- O modelo suporta uma janela de contexto de 1 milhão de tokens e é executado nos chips Huawei Ascend 950 e Cambricon.
- A movimentação de preços segue acusações dos EUA de que empresas chinesas estão distilando modelos de IA americanos em larga escala e segue cortes de preços semelhantes da OpenAI, Anthropic e Google.
- Analistas citam a arquitetura do V4-Pro como um possível ponto de inflexão para aplicações de IA de contexto de longo prazo.
- A DeepSeek visa atrair desenvolvedores, startups e pequenas empresas com IA de baixo custo e pesos abertos.
DeepSeek anunciou um desconto promocional de 75% em seu novo modelo V4-Pro e reduziu as taxas de cache-hit em toda a sua API para 10% das taxas anteriores. O corte de preços, efetivo imediatamente e válido até 5 de maio de 2026, torna o modelo mais barato do que as ofertas da OpenAI, Anthropic e Google, mesmo ao preço cheio. A medida intensifica uma batalha de preços em meio a acusações dos EUA de que empresas chinesas estão distilando modelos de IA americanos em larga escala, posicionando a DeepSeek como uma alternativa de baixo custo para desenvolvedores e empresas.
A DeepSeek anunciou uma redução de preços abrangente na segunda-feira, oferecendo um desconto de 75% em seu modelo V4-Pro e reduzindo as taxas de cache-hit em toda a suite de API para um décimo dos níveis anteriores. Os preços promocionais são válidos até 5 de maio de 2026 e estão disponíveis imediatamente.
Ao preço padrão, o V4-Pro já custa $0,145 por milhão de tokens de entrada e $3,48 por milhão de tokens de saída, superando a OpenAI’s GPT-5.5, a Google’s Gemini 3.1 Pro e a Anthropic’s Claude Opus 4.7 em uma base por token. O novo desconto reduz o preço do token de entrada para aproximadamente $0,036 por milhão de tokens, um contraste marcante com seus rivais.
A redução da taxa de cache-hit tem como alvo os usuários frequentes e os desenvolvedores de empresas que enviam solicitações repetitivas - um padrão dominante em aplicações de produção de classe agente. Ao cobrar apenas 10% da taxa de cache anterior, a DeepSeek busca reduzir o custo total de execução de cargas de trabalho de grande contexto.
O V4-Pro, lançado na última sexta-feira, é um modelo de mistura de especialistas com 1,6 trilhão de parâmetros totais e 49 bilhões de parâmetros ativos por tarefa. Ele suporta uma janela de contexto de 1 milhão de tokens, permitindo que os desenvolvedores processem extensos código-fontes ou longos documentos sem dividir as chamadas. O modelo é executado nos chips Huawei Ascend 950 e Cambricon, em vez de GPUs Nvidia, uma escolha de design que pode redefinir o cenário de hardware de IA.
Observadores da indústria notam o timing estratégico. O desconto chega apenas dias após a Casa Branca ter alertado que entidades estrangeiras, principalmente na China, estavam realizando uma "distilação em larga escala" de modelos de IA dos EUA. Embora a DeepSeek não tenha sido mencionada na nota, a empresa enfrentou acusações da OpenAI e da Anthropic de distilação de modelos. Em vez de se envolver diretamente, a DeepSeek respondeu com preços agressivos, sinalizando confiança de que a competitividade de custo, o acesso aberto a pesos e a capacidade de contexto de longo prazo vão conquistar os desenvolvedores.
Analistas destacam o impacto mais amplo. Zhang Yi, da iiMedia, chamou a arquitetura do V4 de "ponto de inflexão genuíno" para a IA de contexto ultra-longo, prevendo uma adoção rápida além dos laboratórios de pesquisa. Wei Sun, da Counterpoint Research, acrescentou que o uso de chips nacionais reduz a dependência da Nvidia e pode acelerar tanto a implantação de IA chinesa quanto global.
A estratégia de preços da DeepSeek segue um padrão estabelecido no início do ano, quando seu modelo R1 entrou no mercado a uma fração do custo da OpenAI. A empresa continua a combinar a disponibilidade de modelos de código aberto com taxas de API agressivas, visando remover tanto as barreiras de acesso quanto as de custo para startups, pequenas empresas e desenvolvedores individuais. Akshar Keremane, co-fundador da startup de IA O-Health, com sede em Bangalore, descreveu a combinação como uma redução dos obstáculos de entrada para "desenvolvedores, startups e pequenas empresas".
Os provedores de IA dos EUA também têm reduzido os preços. A OpenAI, a Anthropic e a Google ajustaram suas taxas de API nos últimos meses. A última movimentação da DeepSeek se destaca por sua escala - um corte promocional de 75% sobre um modelo já de baixo custo - enquanto o timing coincide com o lançamento da GPT-5.5 da OpenAI e com a tensão geopolítica aumentada sobre a transferência de tecnologia de IA.
Para os desenvolvedores que pesam as opções de API, a DeepSeek agora oferece uma proposta convincente: um modelo de alto parâmetro e contexto de longo prazo a um custo que supera as alternativas líderes do Ocidente, combinado com taxas de cache reduzidas que diminuem ainda mais os gastos operacionais. Se a guerra de preços vai impulsionar uma consolidação mais ampla da indústria ou despertar novas inovações, ainda está para ser visto, mas o efeito imediato é claro - a DeepSeek está se posicionando como a porta de entrada mais acessível para o desempenho de IA de ponta.