O custo das GPUs Nvidia Blackwell dobra, mas a despesa com inferência por token cai 35x em comparação com a Hopper

De acordo com a análise mais recente do blog da Nvidia, as GPUs Blackwell custam quase o dobro por hora em comparação com a geração Hopper, mas entregam 35 vezes menos custos de inferência por token. Usando o modelo de teste DeepSeek-R1, Blackwell (GB300 NVL72) é alugado por US$ 2,65 por GPU por hora, enquanto o Hopper custa US$ 1,41. Ainda assim, o throughput de uma única GPU salta de 90 para 6.000 tokens por segundo. Esse ganho de throughput de 65x reduz os custos por milhão de tokens de US$ 4,20 para US$ 0,12.

O valor de US$ 0,12 pressupõe otimização total de software, incluindo inferência com FP4 em baixa precisão e previsão de múltiplos tokens (MTP). Sem MTP habilitado, os custos por milhão de tokens chegam a aproximadamente US$ 2,35, caindo para US$ 0,11 com ele ativo, demonstrando um impacto de otimização de 21x atribuível apenas a esse recurso.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

A OpenAI Anuncia o Lançamento do Modelo de Cibersegurança GPT-5.5-Cyber nos Próximos Dias

De acordo com a Cointelegraph, Sam Altman anunciou que a OpenAI lançará o GPT-5.5-Cyber, um modelo de cibersegurança, nos próximos dias. O modelo será disponibilizado a defensores críticos de cibersegurança, com a OpenAI planejando estabelecer mecanismos de acesso confiáveis em colaboração com entidades governamentais para

GateNews7m atrás

CEO da Google DeepMind prevê que a AGI chega até 2030, dando às empresas quatro anos para se preparar

Na série de vídeos da Sequoia Capital com a participação de Demis Hassabis, o CEO da Google DeepMind prevê que a inteligência geral artificial (AGI) chegará até 2030. Hassabis, vencedor do Prêmio Nobel de Química de 2024, vê esse cronograma como uma realidade estritamente ligada aos negócios que obriga os líderes a repensar o produto de

GateNews11m atrás

OpenAI para operar como uma empresa perpetuamente de baixa lucratividade, assina acordo de energia de 20 anos

De acordo com a Odaily, o CEO da OpenAI, Sam Altman, afirmou no Stripe Sessions que a OpenAI pretende se tornar uma empresa de infraestrutura massiva e com crescimento rápido, porém com lucro permanentemente baixo, oferecendo produtos semelhantes a um “medidor inteligente” que os usuários podem comprar para automatizar operações de negócios ou incorporar em

GateNews12m atrás

Forefront Tech conclui a precificação do IPO $100M e planeja abrir listagem na Nasdaq

De acordo com a ChainCatcher, a Forefront Tech Holdings Acquisition Corp concluiu a precificação de uma IPO de US$ 100 milhões em 30 de abril, com previsão de listagem na Nasdaq sob o ticker FTHAU. Os recursos serão usados para explorar oportunidades de fusões e aquisições em blockchain, inteligência artificial, fintech e outras

GateNews49m atrás

Ex-executivo da Meta arrecada fundos para startup de IA Flourish em avaliação de US$ 2,5 bilhões

De acordo com a Bloomberg, Thomas Reardon, ex-executivo da Meta que liderou o trabalho na Meta's Neural Band, está levantando fundos para a Flourish, uma nova startup de IA focada em sistemas de IA de baixo consumo. A Lux Capital e a Google Ventures concordaram em ser grandes investidoras, com apoiadores que já se comprometeram com US$ 500 milhões em uma avaliação de US$ 2,5

GateNews51m atrás

OpenAI rastreia o problema do Goblin até um sinal de recompensa de personalidade nerd, menções ao Goblin disparam 175% no GPT-5.1

De acordo com a OpenAI, a empresa identificou a causa raiz do problema dos “goblins” que assolou os modelos de GPT a partir do GPT-5.1. Um sinal de recompensa usado para reforçar a característica de personalidade “Nerdy” incentivou outputs que continham referências a criaturas de fantasia, com 76,2% do conjunto de treinamento mostrando

GateNews1h atrás
Comentário
0/400
Sem comentários