Theo phân tích blog mới nhất của Nvidia, GPU Blackwell có chi phí gần gấp đôi theo giờ so với thế hệ Hopper, nhưng lại mang đến chi phí suy luận theo mỗi token thấp hơn 35 lần. Dùng DeepSeek-R1 làm mô hình thử nghiệm, Blackwell (GB300 NVL72) cho thuê ở mức 2,65 USD mỗi GPU mỗi giờ, trong khi Hopper là 1,41 USD. Tuy nhiên, thông lượng trên một GPU tăng từ 90 lên 6.000 token mỗi giây. Mức tăng thông lượng 65 lần này làm giảm chi phí theo 1 triệu token từ 4,20 USD xuống 0,12 USD.
Con số 0,12 USD giả định tối ưu phần mềm đầy đủ, bao gồm suy luận độ chính xác thấp FP4 và dự đoán đa token (MTP). Nếu không bật MTP, chi phí theo 1 triệu token đạt khoảng 2,35 USD, sau đó giảm xuống 0,11 USD khi bật tính năng này, cho thấy chỉ riêng MTP đã tạo ra tác động tối ưu 21 lần.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
OpenAI Công bố sắp ra mắt mô hình an ninh mạng GPT-5.5-Cyber trong vài ngày tới
Theo Cointelegraph, Sam Altman cho biết OpenAI sẽ ra mắt GPT-5.5-Cyber, một mô hình về an ninh mạng, trong vài ngày tới. Mô hình sẽ được cung cấp cho các nhà bảo vệ an ninh mạng quan trọng, và OpenAI dự định thiết lập các cơ chế truy cập được tin cậy với sự phối hợp của các cơ quan chính phủ để
GateNews7phút trước
Giám đốc điều hành Google DeepMind dự đoán AGI sẽ xuất hiện vào năm 2030, cho các công ty bốn năm để chuẩn bị
Theo loạt video của Sequoia Capital với sự góp mặt của Demis Hassabis, CEO của Google DeepMind dự đoán trí tuệ nhân tạo tổng quát (AGI) sẽ xuất hiện vào năm 2030. Hassabis, người đoạt Giải Nobel Hóa học năm 2024, coi mốc thời gian này là một thực tế kinh doanh nghiêm ngặt, buộc các nhà lãnh đạo phải suy nghĩ lại cách phát triển sản phẩm de
GateNews11phút trước
OpenAI vận hành như một công ty lợi nhuận thấp kéo dài, ký hợp đồng mua điện trong 20 năm
Theo Odaily, CEO của OpenAI Sam Altman cho biết tại Stripe Sessions rằng OpenAI đặt mục tiêu trở thành một công ty hạ tầng có lợi nhuận thấp một cách bền vững nhưng quy mô lớn và tăng trưởng nhanh, cung cấp các sản phẩm tương tự như một “công tơ thông minh” mà người dùng có thể mua để tự động hóa hoạt động kinh doanh hoặc nhúng vào
GateNews12phút trước
Forefront Tech hoàn tất định giá IPO $100M , sẽ niêm yết trên Nasdaq
Theo ChainCatcher, Forefront Tech Holdings Acquisition Corp đã hoàn tất định giá IPO 100 triệu USD vào ngày 30/4, dự kiến niêm yết trên Nasdaq với mã FTHAU. Số tiền thu được sẽ được sử dụng để tìm kiếm cơ hội sáp nhập và mua lại trong blockchain, trí tuệ nhân tạo, fintech và các lĩnh vực khác
GateNews48phút trước
Cựu lãnh đạo Meta huy động vốn cho startup AI Flourish với định giá 2,5 tỷ USD
Theo Bloomberg, Thomas Reardon, cựu giám đốc điều hành của Meta, người từng dẫn dắt mảng công việc liên quan đến Neural Band của Meta, đang huy động vốn cho Flourish, một startup AI mới tập trung vào các hệ thống AI tiêu tốn ít năng lượng. Lux Capital và Google Ventures đã đồng ý trở thành các nhà đầu tư lớn, và các nhà hậu thuẫn hiện đã cam kết 500 triệu USD ở mức định giá 2,5
GateNews51phút trước
OpenAI Truy Vết Vấn Đề “Goblin” Tới Tín Hiệu Phần Thưởng Nhân Cách “Nerdy”, Các Nhắc Đến “Goblin” Tăng 175% Trong GPT-5.1
Theo OpenAI, công ty đã xác định được nguyên nhân gốc rễ của vấn đề “goblin” đã gây ảnh hưởng đến các mô hình GPT từ GPT-5.1 trở đi. Tín hiệu phần thưởng được dùng để củng cố đặc điểm tính cách “Nerdy” đã khuyến khích các đầu ra có nhắc đến các sinh vật giả tưởng, với 76,2% của tập dữ liệu huấn luyện cho thấy
GateNews1giờ trước