Os GPU Nvidia Blackwell custam o dobro, mas o custo da inferência por token desce 35x face ao Hopper

De acordo com a análise mais recente no blog da Nvidia, as GPUs Blackwell custam quase o dobro por hora em comparação com a geração Hopper, mas entregam custos de inferência por token 35 vezes mais baixos. Usando o modelo de teste DeepSeek-R1, a Blackwell (GB300 NVL72) é alugada a 2,65 USD por GPU por hora, face aos 1,41 USD da Hopper, mas o throughput de um único GPU salta de 90 para 6.000 tokens por segundo. Este ganho de throughput de 65x reduz os custos por milhão de tokens de 4,20 USD para 0,12 USD.

O valor de 0,12 USD assume optimização total de software, incluindo inferência com baixa precisão FP4 e previsão multi-token (MTP). Sem MTP activado, os custos por milhão de tokens atingem aproximadamente 2,35 USD, descendo para 0,11 USD com ele ativo, demonstrando um impacto de optimização de 21x apenas com essa funcionalidade.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A OpenAI anuncia o lançamento do modelo de cibersegurança GPT-5.5-Cyber nos próximos dias

Segundo a Cointelegraph, Sam Altman anunciou que a OpenAI vai lançar o GPT-5.5-Cyber, um modelo de cibersegurança, nos próximos dias. O modelo será disponibilizado a defensores críticos de cibersegurança, com a OpenAI a planear estabelecer mecanismos de acesso fiáveis em colaboração com entidades governamentais para

GateNews7m atrás

O CEO da Google DeepMind prevê que a AGI chega até 2030, dando às empresas quatro anos para se prepararem

De acordo com a série de vídeos da Sequoia Capital com Demis Hassabis, o CEO da Google DeepMind prevê que a inteligência artificial geral (AGI) vai chegar até 2030. Hassabis, vencedor do Prémio Nobel de Química em 2024, vê este calendário como uma realidade empresarial estrita que obriga os líderes a repensar o produto de

GateNews11m atrás

OpenAI para operar como uma empresa de lucro perpetuamente baixo, assina um contrato de energia de 20 anos

Segundo a Odaily, o CEO da OpenAI, Sam Altman, afirmou no Stripe Sessions que a OpenAI pretende tornar-se uma empresa de infraestruturas massiva e de crescimento rápido, com lucros perpetuamente baixos, oferecendo produtos semelhantes a um “contador inteligente” que os utilizadores podem comprar para automatizar as operações de negócio ou incorporar em

GateNews12m atrás

A Forefront Tech conclui a definição de preços do IPO $100M , para cotar na Nasdaq

De acordo com a ChainCatcher, a Forefront Tech Holdings Acquisition Corp concluiu a fixação do preço de um IPO de 100 milhões de dólares a 30 de abril, com estreia prevista na Nasdaq sob o símbolo FTHAU. Os proventos serão usados para explorar oportunidades de fusões e aquisições em blockchain, inteligência artificial, fintech e outras

GateNews49m atrás

Ex-executiva da Meta angaria fundos para a startup de IA Flourish numa valorização de 2,5 mil milhões

Segundo a Bloomberg, Thomas Reardon, ex-executivo da Meta que liderou o trabalho na Neural Band da Meta, está a angariar fundos para a Flourish, uma nova startup de IA focada em sistemas de IA de baixo consumo. A Lux Capital e a Google Ventures acordaram ser investidores de referência, com investidores já a comprometer 500 milhões de dólares a uma avaliação de 2,5

GateNews51m atrás

OpenAI Rastreia o Problema do Goblin até um Sinal de Recompensa da Personalidade “Nerd”, As Menções a Goblin Disparam 175% no GPT-5.1

De acordo com a OpenAI, a empresa identificou a causa raiz do problema dos “goblins” que afetou os modelos GPT a partir do GPT-5.1. Um sinal de recompensa usado para reforçar a característica de personalidade “Nerdy” incentivou resultados que incluíam referências a criaturas de fantasia, com 76,2% do conjunto de dados de treino a mostrar

GateNews1h atrás
Comentar
0/400
Nenhum comentário