Die Nvidia-Blackwell-GPUs kosten das Doppelte, aber die Ausgaben für die Inferenz pro Token sinken um das 35-Fache im Vergleich zu Hopper

Laut Nvidias neuester Blog-Analyse kosten Blackwell-GPUs pro Stunde nahezu das Doppelte im Vergleich zur Hopper-Generation, senken aber die Inferenzkosten pro Token um den Faktor 35. Mit DeepSeek-R1 als Testmodell wird Blackwell (GB300 NVL72) für 2,65 US-Dollar pro GPU und Stunde angemietet, gegenüber 1,41 US-Dollar für Hopper. Gleichzeitig steigt der Single-GPU-Durchsatz von 90 auf 6.000 Tokens pro Sekunde. Dieser Zuwachs um 65x senkt die Kosten pro Million Token von 4,20 US-Dollar auf 0,12 US-Dollar.

Der Wert von 0,12 US-Dollar setzt eine vollständige Software-Optimierung voraus, einschließlich FP4-Low-Precision-Inferenz und Multi-Token Prediction (MTP). Ohne MTP erreichen die Kosten pro Million Token etwa 2,35 US-Dollar; mit aktivem MTP sinken sie auf 0,11 US-Dollar. Damit zeigt sich allein durch diese Funktion eine Optimierungswirkung von 21x.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

OpenAI kündigt den Start eines GPT-5.5-Cyber-Kybersecurity-Modells in den kommenden Tagen an

Laut Cointelegraph hat Sam Altman angekündigt, dass OpenAI in den kommenden Tagen GPT-5.5-Cyber, ein Cybersicherheitsmodell, auf den Weg bringen wird. Das Modell soll wichtigen Cybersicherheits-Defendern zur Verfügung gestellt werden, während OpenAI plant, in Zusammenarbeit mit staatlichen Stellen Mechanismen für einen vertrauenswürdigen Zugang aufzubauen, um

GateNews15M her

Der CEO von Google DeepMind sagt voraus, dass AGI bis 2030 eintrifft und Unternehmen vier Jahre Zeit haben, sich vorzubereiten

Laut einer Videoreihe von Sequoia Capital mit Demis Hassabis geht der CEO von Google DeepMind davon aus, dass die Künstliche Allgemeine Intelligenz (AGI) bis 2030 eintreffen wird. Hassabis, ein Nobelpreisträger für Chemie 2024, sieht diesen Zeitplan als eine harte Geschäftsrealität, die Führungskräfte dazu zwingt, über das Produktdenken neu nachzudenken

GateNews20M her

OpenAI wird als dauerhaftes Unternehmen mit geringer Gewinnmarge operieren und unterzeichnet einen 20-Jahres-Stromvertrag

Laut Odaily sagte OpenAI-CEO Sam Altman bei den Stripe Sessions, dass OpenAI darauf abzielt, ein dauerhaft niedrigmargiges, aber massives und schnell wachsendes Infrastrukturunternehmen zu werden und Produkte anzubieten, die ähnlich wie ein „intelligenter Zähler“ sind, den Nutzer kaufen können, um damit Geschäftsprozesse zu automatisieren oder ihn in

GateNews20M her

Forefront Tech schließt die $100M -IPO-Preisfestsetzung ab und will an der Nasdaq notieren

Laut ChainCatcher hat Forefront Tech Holdings Acquisition Corp am 30. April die Emissionspreisfestlegung für einen Börsengang in Höhe von 100 Millionen US-Dollar abgeschlossen, der unter dem Tickersymbol FTHAU an der Nasdaq gelistet werden soll. Der Erlös wird eingesetzt, um Möglichkeiten für Fusionen und Übernahmen in den Bereichen Blockchain, Künstliche Intelligenz, Fintech und andere zu prüfen

GateNews57M her

Ehemaliger Meta-Manager sammelt Gelder für ein KI-Startup Flourish bei einer Bewertung von 2,5 Milliarden US-Dollar

Laut Bloomberg erhebt Thomas Reardon, ehemaliger Meta-Manager, der die Arbeit an Metas Neural Band leitete, Gelder für Flourish, ein neues KI-Startup mit Fokus auf stromsparende KI-Systeme. Lux Capital und Google Ventures haben sich darauf verständigt, als wichtigste Investoren aufzutreten, wobei Unterstützer bereits 500 Millionen US-Dollar bei einer Bewertung von 2,5

GateNews1Std her

OpenAI verfolgt das Goblin-Problem auf ein nerdiges Belohnungssignal für die Persönlichkeit zurück, Goblin-Erwähnungen steigen um 175% in GPT-5.1

Laut OpenAI hat das Unternehmen die ursprüngliche Ursache des „Goblin“-Problems identifiziert, das GPT-Modelle ab GPT-5.1.1 plagte. Ein Belohnungssignal, das dazu genutzt wurde, den „Nerdy“-Persönlichkeitszug zu verstärken, förderte Ausgaben, die Verweise auf Fantasiewesen enthielten, wobei 76,2% des Trainingsdatensatzes Folgendes zeigte

GateNews1Std her
Kommentieren
0/400
Keine Kommentare