DeepSeek lança série de modelos de código aberto V4 com 1,6T de parâmetros e Licença MIT

Mensagem de Gate News, 24 de abril — A DeepSeek lançou a série V4 de modelos de código aberto sob a Licença MIT, com pesos agora disponíveis no Hugging Face e no ModelScope. A série inclui dois modelos (MoE) de especialistas em mistura: V4-Pro com 1,6 trilhão de parâmetros totais e 49 bilhões ativados por token, e V4-Flash com 284 bilhões de parâmetros totais e 13 bilhões ativados por token. Ambos suportam uma janela de contexto de 1 milhão de tokens.

A arquitetura traz três melhorias principais: um mecanismo de atenção híbrido que combina atenção esparsa comprimida (CSA) e atenção fortemente comprimida (HCA), reduzindo significativamente a sobrecarga de contextos longos — os FLOPs de inferência do V4-Pro para contexto de 1M são apenas 27% dos do V3.2, e o cache de KV (VRAM para armazenar informações históricas durante a inferência) é apenas 10% do do V3.2; hipervínculos com restrição de manifold (mHC) substituindo conexões residuais tradicionais para aprimorar a estabilidade da propagação de sinais entre camadas; e o otimizador Muon para acelerar a convergência do treinamento. O pré-treinamento usou mais de 32 trilhões de tokens de dados.

O pós-treinamento emprega uma abordagem em duas etapas: primeiro, treinar especialistas específicos de domínio via fine-tuning supervisionado (SFT) e aprendizado por reforço com GRPO, depois fundi-los em um único modelo por meio de distilação online. O V4-Pro-Max (highest inference mode) afirma ser o modelo de código aberto mais forte, com benchmarks de codificação de ponta e lacunas significativamente reduzidas em relação a modelos de fronteira de código fechado em tarefas de raciocínio e de agentes. O V4-Flash-Max atinge desempenho de raciocínio no nível do Pro com orçamento de computação suficiente, mas é limitado pela escala de parâmetros em tarefas puramente de conhecimento e tarefas de agentes complexas. Os pesos são armazenados em precisão mista FP4+FP8.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

DeepRoute.ai 進階輔助駕駛系統突破 30 萬車輛 implantação: 2026 目标 100 万城市 frota NOA

A DeepRoute.ai anunciou que seu avançado sistema de assistência ao motorista já acumulou mais de 300 mil veículos implantados na China, ajudando a evitar mais de 180 mil incidentes em potencial no ano passado. A meta para 2026 é alcançar uma frota de 1 milhão de veículos para o NOA urbano, com taxa de utilização superior a 50%, sendo considerada um fator-chave para a comercialização em larga escala do Robotaxi. Esta iniciativa indica que a condução autônoma na China já entrou em uso rotineiro, ao mesmo tempo em que se diferencia das rotas de integração vertical com os Estados Unidos, influenciando o cronograma da cadeia de suprimentos na Ásia-Pacífico.

ChainNewsAbmedia24m atrás

DeepSeek Lança os Modelos V4-Pro e V4-Flash com Custo 98% Menor do que o GPT-5.5 Pro da OpenAI

Mensagem do Gate News, 25 de abril — O DeepSeek lançou versões de prévia de V4-Pro e V4-Flash em 24 de abril, ambos modelos de pesos abertos com janelas de contexto de um milhão de tokens. O V4-Pro tem 1,6 trilhão de parâmetros no total, mas ativa apenas 49 bilhões por passagem de inferência usando uma arquitetura de Mixture-of-Experts.

GateNews5h atrás

Juiz rejeita alegações de fraude no processo de Elon Musk contra a OpenAI; caso avança a julgamento com duas acusações restantes

Mensagem do Gate News, 24 de abril — Uma juíza federal indeferiu as alegações de fraude do processo de Elon Musk contra a OpenAI, Sam Altman, Greg Brockman e a Microsoft, abrindo caminho para que o caso avance a julgamento por duas acusações remanescentes: violação de confiança filantrópica e enriquecimento sem causa. EUA.

GateNews8h atrás

CEO da OpenAI, Sam Altman, pede desculpas por não denunciar à polícia a conta banida do atirador da escola

Mensagem do Gate News, 25 de abril — O CEO da OpenAI, Sam Altman, pediu desculpas à comunidade de Tamborine, no Canadá, pela falha da empresa em notificar a polícia sobre uma conta banida ligada a Jesse Van Rootselaar, que matou oito pessoas em uma escola em fevereiro antes de tirar a própria vida. OpenAI

GateNews9h atrás

Emirados Árabes Unidos anuncia mudança em direção a um modelo de governo com IA nos próximos dois anos

Sua Alteza Sheikh Mohammed bin Rashid Al Maktoum afirmou que o objetivo era fazer com que 50% dos setores do governo operassem por meio de IA agentica autônoma. A transição também incluirá o treinamento de funcionários federais para “dominar IA” e será supervisionada por Sheikh Mansour bin Zayed. Principais destaques:

Coinpedia9h atrás

Plataforma de negociação com IA Fere AI arrecada US$ 1,3M em financiamento liderado pela Ethereal Ventures

Mensagem de notícias da Gate, 25 de abril — A Fere AI, uma plataforma de negociação de ativos digitais alimentada por IA, anunciou a conclusão de uma rodada de financiamento de US$ 1,3 milhão liderada pela Ethereal Ventures, com participação da Galaxy Vision Hill e da Kosmos Ventures, de acordo com a Globenewswire. A plataforma oferece suporte a redes cross-chain

GateNews10h atrás
Comentário
0/400
Sem comentários