根据 Nvidia 最新博客分析,Blackwell GPU 的每小时成本几乎是 Hopper 代际的两倍,但每个 token 的推理成本却低 35 倍。以 DeepSeek-R1 作为测试模型,Blackwell(GB300 NVL72)按每 GPU 每小时 2.65 美元出租,而 Hopper 为 1.41 美元;但单个 GPU 的吞吐量从 90 跃升至 6,000 每秒 token。这样 65 倍的吞吐量增益使每百万 token 成本从 4.20 美元降至 0.12 美元。
0.12 美元这一数值假设完成了全套软件优化,包括 FP4 低精度推理和多 token 预测(MTP)。如果未启用 MTP,每百万 token 成本约为 2.35 美元,启用后降至 0.11 美元,表明仅该特性就带来了 21 倍的优化效果。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
OpenAI 宣布将在未来几天推出 GPT-5.5-Cyber 网络安全模型
据 Cointelegraph 称,Sam Altman 宣布 OpenAI 将在未来几天推出 GPT-5.5-Cyber,这是一种网络安全模型。该模型将提供给关键网络安全防御者使用,OpenAI 计划与政府机构合作建立可信访问机制,以便
GateNews7 分钟前
谷歌 DeepMind 首席执行官预测 AGI 将于 2030 年前到来,并给予公司四年准备时间
根据 Sequoia Capital 以 Demis Hassabis 为主角的视频系列,谷歌 DeepMind 的首席执行官预测,人工通用智能(AGI)将在 2030 年到来。Hassabis 是 2024 年诺贝尔化学奖得主,他将这一时间表视为一种严苛的商业现实,这迫使领导者重新思考产品 de
GateNews11 分钟前
OpenAI 拟作为永续低利润公司运营,签署 20 年电力协议
据 Odaily,OpenAI 首席执行官 Sam Altman 在 Stripe Sessions 上表示,OpenAI 旨在成为一家永续低利润、但规模巨大且增长迅速的基础设施公司,提供类似于“智能电表”的产品,用户可以购买以自动化业务运营,或嵌入到
GateNews11 分钟前
Forefront Tech 完成 $100M IPO 定价,计划在 Nasdaq 上市
据 ChainCatcher 报道,Forefront Tech Holdings Acquisition Corp 于 4 月 30 日完成 1 亿美元 IPO 定价,计划在纳斯达克上市,股票代码为 FTHAU。募集资金将用于探索区块链、人工智能、金融科技及其他领域的并购机会
GateNews48 分钟前
前 Meta 高管为 AI 初创公司 Flourish 融资,并以 25 亿美元估值
据 Bloomberg,曾领导 Meta 的 Neural Band 相关工作的前 Meta 高管 Thomas Reardon 正在为 Flourish 融资,这是一家专注于低功耗 AI 系统的新 AI 初创公司。Lux Capital 和 Google Ventures 已同意成为主要投资方,支持者目前已承诺投入 5 亿美元,估值 2.5
GateNews51 分钟前
OpenAI 追踪 Goblin 问题到书呆子型人格奖励信号,Goblin 提到其在 GPT-5.1 中飙升 175%
根据 OpenAI, 该公司已找出从 GPT-5.1 起困扰 GPT 模型的“地精”问题的根本原因。用于强化“书呆子”人格特质的奖励信号会鼓励生成包含奇幻生物引用的内容,其中训练数据集有 76.2% 的内容显示
GateNews1小时前