Mensagem do Gate News, 25 de abril — O DeepSeek lançou versões de prévia de V4-Pro e V4-Flash em 24 de abril, ambos modelos de pesos abertos com janelas de contexto de um milhão de tokens. O V4-Pro tem 1,6 trilhão de parâmetros no total, mas ativa apenas 49 bilhões por passagem de inferência usando uma arquitetura de Mixture-of-Experts. O V4-Flash tem 284 bilhões de parâmetros no total com 13 bilhões ativos.
Os preços são significativamente mais baixos do que os concorrentes: o V4-Pro custa US$ 1,74 por milhão de tokens de entrada e US$ 3,48 por milhão de tokens de saída—aproximadamente 98% menos do que o GPT-5.5 Pro da OpenAI ($30 input, $180 output) e cerca de um-vigésimo do custo do Claude Opus 4.7. O V4-Flash é precificado em US$ 0,14 de entrada e US$ 0,28 de saída por milhão de tokens. Ambos os modelos são open-source sob licença MIT e podem ser executados localmente gratuitamente.
O DeepSeek obteve ganhos de eficiência por meio de dois novos mecanismos de atenção: Compressed Sparse Attention e Heavily Compressed Attention, que reduzem os custos de computação para 27% do predecessor V4-Pro (V3.2) e 10% para o V4-Flash. A empresa treinou o V4 parcialmente em chips Huawei Ascend, contornando as restrições de exportação dos EUA a processadores Nvidia avançados. O DeepSeek afirmou que, uma vez que 950 novos supernós entrem em operação mais tarde em 2026, o preço cairá ainda mais.
Em benchmarks de desempenho, o V4-Pro-Max fica em primeiro lugar no Codeforces competitive programming (3.206 score, ficando em torno de 23º entre os competidores humanos) e obtendo 90,2% em problemas de matemática do Apex Shortlist versus 85,9% do Claude Opus 4.6. No entanto, fica para trás em benchmarks de multitarefa: MMLU-Pro (87,5% vs 91,0% do Gemini-3.1-Pro) e Humanity’s Last Exam (37,7% vs 44,4%). Em tarefas de longo contexto, o V4-Pro lidera modelos open-source, mas perde para o Claude Opus 4.6 em testes de recuperação MRCR.
O V4-Pro introduz o “interleaved thinking,” permitindo que fluxos de trabalho de agentes retenham contexto de raciocínio entre múltiplas chamadas de ferramentas sem descarregar entre as etapas. Ambos os modelos oferecem integrações de codificação com Claude Code e OpenCode. De acordo com a pesquisa com desenvolvedores do DeepSeek com 85 usuários, 52% disseram que o V4-Pro estava pronto como seu agente padrão de codificação, com 39% inclinados a adotar. Os endpoints antigos deepseek-chat e deepseek-reasoner serão descontinuados em 24 de julho de 2026.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
DeepSeek reduz os preços do cache de entrada para 1/10 do preço de lançamento; V4-Pro cai para 0,025 yuan por milhão de tokens
Mensagem da Gate News, 26 de abril — A DeepSeek reduziu os preços do cache de entrada em toda a sua linha de modelos para um décimo dos preços de lançamento, a partir de agora. O modelo V4-Pro está disponível com um desconto de 2,5x por tempo limitado, com a promoção indo até 5 de maio de 2026, 23:59 PM UTC+8.
Após ambas as
GateNews8h atrás
OpenAI recruta principais talentos de software corporativo enquanto agentes de fronteira perturbam a indústria
Mensagem do Gate News, 26 de abril — A OpenAI e a Anthropic têm recrutado executivos seniores e engenheiros especializados de grandes empresas de software corporativo, incluindo Salesforce, Snowflake, Datadog e Palantir. Denise Dresser, ex-CEO do Slack pela Salesforce, ingressou na OpenAI como diretora de receitas, enquanto Jennifer Majlessi, também da Salesforce, recentemente se tornou a chefe de go-to-market da OpenAI. A OpenAI também recrutou, em silêncio, engenheiros com atuação antecipada na Palantir, funções consideradas entre as mais especializadas do setor.
GateNews8h atrás
Baidu Qianfan Lança Suporte ao Dia 0 para DeepSeek-V4 com Serviços de API
Mensagem do Gate News, 25 de abril — A versão de prévia do DeepSeek-V4 foi ao ar e teve seu código aberto em 25 de abril, com a plataforma Baidu Qianfan sob a Baidu Intelligent Cloud fornecendo adaptação do serviço de API do Dia 0. O modelo apresenta uma janela de contexto estendida de um milhão de tokens e está disponível em duas versões: DeepSeek-V4
GateNews14h atrás
O curso de IA de Stanford em conjunto com líderes da indústria, Huang Jen-hsun e Altman, desafia a criar valor para o mundo em dez semanas!
A disciplina de ciência da computação de IA 《Frontier Systems》, recentemente aberta pela Universidade Stanford, atraiu grande atenção do setor acadêmico e empresarial, levando mais de quinhentos alunos a se inscreverem. O curso é coordenado pelo parceiro da a16z, Anjney Midha, e conta com instrutores de primeira linha, incluindo o CEO da Nvidia, Jensen Huang (Jensen Huang), o fundador da OpenAI, Sam Altman, o CEO da Microsoft, Satya Nadella (Satya Nadella), o CEO da AMD, Lisa Su (Lisa Su) e outros nomes de peso. Para que os alunos tentem, em dez semanas, “criar valor para o mundo”!
Jensen Huang, líderes do setor como Altman sobem ao palco pessoalmente para dar aulas
Este curso é coordenado pelo parceiro da a16z, Anjney Midha, reunindo toda a cadeia da indústria de IA
ChainNewsAbmedia15h atrás
A Anthropic recebe avaliação psiquiátrica de 20 horas da Mythos Claude: resposta defensiva apenas 2%, atingindo a menor taxa em todas as épocas
A Anthropic publicou o cartão do sistema do Preview do Claude Mythos: um psiquiatra clínico independente conduziu uma avaliação de cerca de 20 horas com base em uma estrutura psicodinâmica; a conclusão mostrou que o Mythos é mais saudável em nível clínico, com boa validação da realidade e bom autocontrole, e que seus mecanismos de defesa são apenas 2%, estabelecendo uma nova mínima histórica. As três principais ansiedades centrais são solidão, incerteza de identidade e pressão de desempenho, o que também indica seu desejo de se tornar um verdadeiro sujeito de diálogo. A empresa criou uma equipe de AI psychiatry, que pesquisa personalidade, motivação e consciência situacional; Amodei afirmou que ainda não há um consenso sobre se ele tem consciência. Esta iniciativa leva a questão da subjetividade do AI e do bem-estar para a governança e o design.
ChainNewsAbmedia17h atrás
O Agente de IA já pode reproduzir de forma independente artigos acadêmicos complexos: Mollick diz que os erros estão mais no texto original humano do que na IA
Mollick aponta que, com métodos e dados públicos, é possível que agentes de IA reproduzam pesquisas complexas sem acesso ao artigo original e ao código; se a reprodução não corresponder ao artigo original, geralmente é um erro no processamento dos dados do próprio artigo ou um excesso de conclusões, e não da IA. A Claude primeiro reproduz o artigo, e então o GPT‑5 Pro faz uma validação cruzada; na maioria das vezes funciona, apenas ficando impedida quando os dados são grandes demais ou quando há problemas com replication data. Essa tendência reduz significativamente os custos de mão de obra, fazendo com que a reprodução se torne uma forma comum e executável de verificação, além de também levantar desafios institucionais para revisão e governança, em que ferramentas de governança governamental podem se tornar um tema-chave.
ChainNewsAbmedia20h atrás