Согласно последнему анализу блога Nvidia, стоимость GPU Blackwell почти вдвое выше за час по сравнению с поколением Hopper, но при этом они обеспечивают в 35 раз более низкие затраты на инференс в пересчёте на токен. В качестве тестовой модели используется DeepSeek-R1: Blackwell (GB300 NVL72) сдается в аренду по $2,65 за GPU в час против $1,41 для Hopper, однако пропускная способность одного GPU растет с 90 до 6 000 токенов в секунду. Этот 65-кратный прирост пропускной способности снижает затраты на миллион токенов с $4,20 до $0,12.
Показатель $0,12 предполагает полную оптимизацию ПО, включая инференс с низкой точностью FP4 и предсказание нескольких токенов (MTP). Если MTP не включена, затраты на миллион токенов достигают примерно $2,35, но при активной MTP они падают до $0,11, демонстрируя 21-кратное влияние оптимизации только от этой функции.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
OpenAI объявляет о запуске модели GPT-5.5-Cyber по кибербезопасности в ближайшие дни
По данным Cointelegraph, Сэм Альтман объявил, что OpenAI запустит GPT-5.5-Cyber — модель по кибербезопасности — в ближайшие дни. Модель будет доступна ключевым защитникам кибербезопасности; OpenAI планирует наладить механизмы доверенного доступа во взаимодействии с государственными структурами, чтобы
GateNews7м назад
Глава Google DeepMind предсказывает, что AGI появится к 2030 году — компаниям дадут четыре года, чтобы подготовиться
В видеосерии Sequoia Capital с участием Дэмиса Хассабиса генеральный директор Google DeepMind предсказывает, что искусственный общий интеллект (AGI) появится к 2030 году. Хассабис, лауреат Нобелевской премии по химии за 2024 год, рассматривает этот график как жёсткую бизнес-реальность, которая заставляет лидеров пересматривать продукт de
GateNews11м назад
OpenAI будет работать как компания с постоянно низкой нормой прибыли, подписывает 20-летний договор на поставку электроэнергии
Как сообщает Odaily, генеральный директор OpenAI Сэм Альтман заявил на Stripe Sessions, что OpenAI стремится стать инфраструктурной компанией с постоянно низкой маржой прибыли, но при этом масштабной и быстрорастущей, предлагая продукты, похожие на «умный счётчик», которые пользователи могут покупать, чтобы автоматизировать бизнес-операции, или встраивать в
GateNews12м назад
Forefront Tech завершает $100M ценообразование IPO, чтобы выйти на Nasdaq
Согласно ChainCatcher, Forefront Tech Holdings Acquisition Corp завершила ценообразование IPO на сумму 100 миллионов долларов 30 апреля; торги планируется начать на Nasdaq под тикером FTHAU. Полученные средства будут использованы для изучения возможностей для сделок по слияниям и поглощениям в блокчейне, искусственном интеллекте, финтехе и других
GateNews49м назад
Бывший руководитель Meta привлекает средства для стартапа в сфере ИИ Flourish при оценке в $2,5B
По данным Bloomberg, Томас Рирдон, бывший руководитель Meta, который возглавлял работу над Neural Band в Meta, собирает средства для Flourish — нового AI-стартапа, ориентированного на системы низкопотребляющего ИИ. Lux Capital и Google Ventures договорились стать ключевыми инвесторами: уже есть участники, которые обязались вложить 500 миллионов долларов при оценке 2,5
GateNews51м назад
OpenAI Traces Goblin Problem to Nerdy Personality Reward Signal, Goblin упоминает всплеск на 175% в GPT-5.1
Согласно OpenAI, компания выявила первопричину проблемы «гоблина», которая затронула модели GPT начиная с GPT-5.1. Сигнал вознаграждения, использовавшийся для подкрепления черты характера «Nerdy», поощрял ответы с упоминаниями фантастических существ: 76,2% обучающего набора данных демонстрировали
GateNews1ч назад