Biaya GPU Nvidia Blackwell Lipat Dua, Namun Biaya Inferensi Per-Token Turun 35x Dibanding Hopper

Menurut analisis blog terbaru Nvidia, GPU Blackwell hampir dua kali lebih mahal per jam dibanding generasi Hopper, namun menghasilkan biaya inferensi per token yang 35 kali lebih rendah. Dengan DeepSeek-R1 sebagai model uji, sewa Blackwell (GB300 NVL72) sebesar $2,65 per GPU per jam, sedangkan Hopper $1,41, tetapi throughput per GPU meningkat dari 90 menjadi 6.000 token per detik. Kenaikan throughput 65x ini menurunkan biaya per sejuta token dari $4,20 menjadi $0,12.

Angka $0,12 mengasumsikan optimasi perangkat lunak penuh termasuk inferensi low-precision FP4 dan multi-token prediction (MTP). Tanpa MTP diaktifkan, biaya per sejuta token mencapai sekitar $2,35, turun menjadi $0,11 dengan MTP aktif, yang menunjukkan dampak optimasi 21x hanya dari fitur tersebut.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

OpenAI Umumkan Peluncuran Model Keamanan Siber GPT-5.5-Cyber dalam Beberapa Hari Mendatang

Menurut Cointelegraph, Sam Altman mengumumkan OpenAI akan meluncurkan GPT-5.5-Cyber, sebuah model untuk keamanan siber, dalam beberapa hari mendatang. Model ini akan disediakan bagi pembela keamanan siber yang kritis, dengan OpenAI merencanakan untuk membangun mekanisme akses tepercaya bekerja sama dengan entitas pemerintah untuk

GateNews7menit yang lalu

CEO Google DeepMind Memperkirakan AGI Tiba pada 2030, Memberi Perusahaan Empat Tahun untuk Bersiap

Dalam rangkaian video Sequoia Capital yang menampilkan Demis Hassabis, CEO Google DeepMind memprediksi kecerdasan buatan umum (AGI) akan tiba pada 2030. Hassabis, pemenang Nobel Kimia 2024, memandang timeline ini sebagai realitas bisnis yang ketat sehingga memaksa para pemimpin untuk meninjau ulang produk de

GateNews11menit yang lalu

OpenAI Akan Beroperasi sebagai Perusahaan Berprofit Rendah Secara Permanen, Menandatangani Kesepakatan Daya 20 Tahun

Menurut Odaily, CEO OpenAI Sam Altman menyatakan pada Stripe Sessions bahwa OpenAI menargetkan menjadi perusahaan infrastruktur berskala besar dengan laba yang rendah secara berkelanjutan, serta pertumbuhan yang masif dan cepat, dengan menawarkan produk serupa “meteran cerdas” yang dapat dibeli pengguna untuk mengotomatisasi operasi bisnis atau ditanamkan ke dalam

GateNews12menit yang lalu

Forefront Tech Menyelesaikan Penetapan Harga $100M IPO, untuk Listing di Nasdaq

Menurut ChainCatcher, Forefront Tech Holdings Acquisition Corp menyelesaikan penetapan harga IPO senilai 100 juta dolar AS pada 30 April, yang akan dicatatkan di Nasdaq dengan ticker FTHAU. Dana hasil penawaran akan digunakan untuk mengeksplorasi peluang merger dan akuisisi di blockchain, kecerdasan buatan, fintech, dan lainnya

GateNews49menit yang lalu

Mantan Eksekutif Meta Menggalang Dana untuk Startup AI Flourish dengan Penilaian $2,5 miliar

Menurut Bloomberg, Thomas Reardon, mantan eksekutif Meta yang memimpin kerja pada Meta's Neural Band, sedang mengumpulkan dana untuk Flourish, sebuah startup AI baru yang berfokus pada sistem AI berdaya rendah. Lux Capital dan Google Ventures telah sepakat menjadi investor utama, dengan para pendukung yang sudah berkomitmen 500 juta dolar pada valuasi 2,5

GateNews51menit yang lalu

OpenAI Melacak Masalah Goblin ke Sinyal Hadiah Kepribadian yang “Nerdy”, Sebutan Goblin Melonjak 175% di GPT-5.1

Menurut OpenAI, perusahaan tersebut mengidentifikasi akar masalah dari problem “goblin” yang melanda model GPT mulai dari GPT-5.1 dan seterusnya. Sinyal imbalan yang digunakan untuk memperkuat sifat kepribadian “Nerdy” mendorong keluaran yang memuat referensi makhluk fantasi, dengan 76,2% dari kumpulan data pelatihan yang menunjukkan

GateNews1jam yang lalu
Komentar
0/400
Tidak ada komentar