Nvidia Blackwell GPUのコストは2倍になるが、1トークンあたりの推論コストはHopperに比べて35倍分下がる

Nvidiaの最新ブログ分析によると、Blackwell GPUはHopper世代と比べて1時間あたりの費用がほぼ2倍になる一方で、1トークンあたりの推論コストは35分の1にまで下がります。テストモデルとしてDeepSeek-R1を使うと、Blackwell(GB300 NVL72)は1GPUあたり1時間$2.65でレンタルできるのに対し、Hopperは$1.41です。しかし、単一GPUのスループットは90から6,000トークン/秒へと急増します。この65倍のスループット向上により、1百万トークンあたりのコストは$4.20から$0.12へと引き下げられます。

$0.12という数値は、FP4の低精度推論やマルチトークン予測(MTP)など、完全なソフトウェア最適化を前提としています。MTPが有効化されていない場合、1百万トークンあたりのコストは約$2.35まで上がり、MTPを有効にすると$0.11まで下がります。これは、その機能だけで最適化の効果が21倍であることを示しています。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

OpenAI、今後数日内にGPT-5.5-Cyber サイバーセキュリティモデルの提供開始を発表

Cointelegraphによると、サム・アルトマンは、OpenAIが今後数日以内にサイバーセキュリティモデル「GPT-5.5-Cyber」をローンチすると発表した。 このモデルは、重要なサイバーセキュリティの防御者に提供される予定であり、OpenAIは政府機関との連携のもとで信頼できるアクセス手段を確立する計画だ。

GateNews7分前

Google DeepMindのCEOは、AGIが2030年までに到来すると予測し、企業に準備のための4年間を与える

セコイア・キャピタルの、デミス・ハサビスが登場する動画シリーズによると、Google DeepMindのCEOは、汎用人工知能(AGI)が2030年までに到来すると予測しています。ハサビスは化学分野で2024年のノーベル賞受賞者で、このタイムラインを、指導者が製品を再考せざるを得なくなる、厳格なビジネス上の現実だと捉えています。製品 de

GateNews11分前

低利益で永続的に運営する企業としてOpenAIが稼働し、20年間の電力契約に署名

Odailyによると、OpenAIのCEOであるサム・アルトマンはStripe Sessionsで、OpenAIは、常に低い利益率でありながら巨大で、かつ急速に成長するインフラ企業になることを目指しており、「インテリジェントメーター」のような製品を提供して、ユーザーがそれを購入することで業務運用を自動化したり、あるいは組み込んだりできるようにすると述べた。

GateNews12分前

Forefront Techは $100M のIPOの価格設定を完了し、NASDAQに上場予定

ChainCatcherによると、Forefront Tech Holdings Acquisition Corpは4月30日に1億ドルのIPO価格決定を完了し、ティッカーFTHAUのもとでナスダックに上場予定。調達資金は、ブロックチェーン、人工知能、フィンテック、その他の分野における合併・買収の機会を検討するために使用される。

GateNews49分前

元メタ幹部がAIスタートアップ「フローリッシュ」へ資金調達、評価額25億ドル

ブルームバーグによると、MetaのNeural Bandの取り組みを率いた元Meta幹部のトーマス・リードンは、低消費電力のAIシステムに焦点を当てた新しいAIスタートアップ「Flourish」のために資金調達を進めている。Lux CapitalとGoogle Venturesは主要投資家になることで合意しており、すでに出資者が$500 millionを、$2.5…までコミットしている。

GateNews51分前

OpenAIは、グレムリン問題を研究し、オタク気質の性格報酬シグナルを追跡し、グレムリンへの言及がGPT-5.1で175%急増した

OpenAIによると、同社はGPT-5.1以降のGPTモデルを悩ませていた「ゴブリン」問題の根本原因を特定した。報酬シグナルが「オタク(Nerdy)」という性格特性を強化するために使われ、その結果、ファンタジー生物への言及を含む出力が促され、訓練データセットの76.2%が示していた

GateNews1時間前
コメント
0/400
コメントなし