打破週期性迷思!一公式拆解 HBM 需求結構:記憶體為何只會繼續上漲?

鏈新聞abmedia

AI 浪潮推動記憶體需求與價格水漲船高,然而外界仍擔憂 HBM 是否會重蹈「週期性」覆徹,像過去的 DRAM 一樣,在需求高峰後迅速反轉?半導體架構分析人士 fin 對此指出,HBM 的需求邏輯,已與傳統記憶體產業規律脫鉤,正透過 token 重新定價。

(記憶體漲勢趨緩?機構評估 Q2 漲幅縮窄至 30%,下半年進一步降溫)

CPU 時代的記憶體:可有可無的附屬品

fin 指出,在 CPU 主導運算的年代,DDR 記憶體的角色始終只是輔助角色。CPU 工程師發展出一整套掩蓋記憶體延遲的架構技巧,包括超純量設計、多層快取、暫存器重新命名等,讓處理器得以在不倚賴高速記憶體的條件下維持高效能:

工業界的經驗法則是,即便 DDR 頻寬直接翻倍,CPU 整體效能的提升也往往不超過兩成。

這樣的架構直接塑造了過去數十年 DRAM 產業的成長節奏。DDR3 到 DDR5,歷時整整十五年;過去十年間,一般 PC 的 DDR 容量從 7 至 8 GB 增長至約 23 GB,十年僅成長三倍。DRAM 廠商的主要獲利來源為容量大小,頻寬升級不過是拉高單位售價的手段。

在 CPU 時代,記憶體就是晶片產業裡邊際效用最低的一環,週期性起伏是常態、也是宿命。

AI 推理時代來臨,從根本改寫記憶體價值標準

然而,當運算主角切換至 AI 推理引擎,衡量標準也隨之更迭,晶片廠商比的是每秒能執行多少次浮點運算;如今,AI 時代的核心 KPI 只有一個:每單位成本與每單位功耗,能夠產生多少個 Token。

輝達執行長黃仁勳所提出的「AI 工廠」概念,精確描述了這套新邏輯:AI 工廠存在的意義,就是以最低成本生產最多 Token,同時把 Token 的輸出速度推向極限。優化目標由單一維度向外擴展,需同時最大化 Token 的總吞吐量,也追求每個請求的 Token 輸出速度。

這個 KPI 的改變,則成了 HBM 命運翻轉的起點。

Token 吞吐量公式,揭開 HBM 需求的第一性原理

fin 將 AI 推理的 Token 吞吐量,拆解為兩個參數的乘積:「同時處理的請求批次數量 × 每個請求的平均 Token 生成速度」追溯這兩個參數各自的瓶頸,答案都指向同一個零件。

批次數量的瓶頸,在於 HBM 的儲存容量。每一個推理請求都攜帶著自己的 KV 快取,也就是模型推理過程中儲存中間狀態的機制,而這份快取必須即時存放在 HBM 之中,以便模型每生成一個 Token 時反覆高速讀取。批次規模越大,HBM 所需的儲存空間就越大,兩者呈線性正比關係。

Token 速度的瓶頸,則在於 HBM 的頻寬。模型解碼階段每產生一個 Token,都需要反覆讀取龐大的啟動權重與 KV 快取,讀取速度直接決定了 Token 的生成效率,而讀取速度的上限,就是 HBM 的頻寬。

他表示,這個關係可以用機場接駁車做比喻:HBM 容量是接駁車的車廂大小,決定一次能載多少乘客;HBM 頻寬是車門的寬度,決定乘客上下車的速度;旅客輸送的總吞吐量,則是車廂大小乘以上車速度的積。由此推導出 AI 推理硬體需求的第一原則:

Token 吞吐量 = HBM 容量 × HBM 頻寬

若要讓每一代 GPU 的 Token 吞吐量維持兩倍的世代成長,HBM 容量與 HBM 頻寬的乘積就必須每代翻倍。

軟體優化解不了題,HBM 需求鎖定在指數軌道上

面對這套推論,市場最常見的反駁是:軟體優化難道不能降低對 HBM 的依賴?他給出的答案是,軟體效率與硬體規格的進步是兩個完全獨立的維度,兩者並不互相取代。這就像 CPU 軟體優化再徹底,仍無法阻止英特爾或 AMD 每一代都必須在標準測試中交出更高的跑分,否則產品就賣不出去。

GPU 的邏輯完全相同:只要全球對 Token 的需求持續擴張,對更高 Token 吞吐量的追求就不會停歇,對 HBM 兩方面進步的需求更不會停止。

更關鍵的是,這股壓力並非來自外部景氣的拉動,而是供應端的內生需求。只要輝達還要販賣下一代 GPU,就必然要向 SK 海力士、三星、美光施壓,要求每一代 HBM 在容量與頻寬上同步躍進,因為 HBM 的天花板,就是 GPU 效能的天花板。

將輝達從 A100 到 Rubin Ultra 各代 GPU 的 Token 吞吐量,與對應的「HBM 容量 × HBM 頻寬」數值繪於同一對數座標圖上,兩條曲線的吻合程度將令人驚訝。這並非歷史巧合,而是系統最佳化的必然解。

HBM 告別週期宿命,市場定價邏輯仍待重估

綜合上述架構層面的推導,HBM 與傳統 DRAM 的本質差異已然清晰。傳統記憶體是晶片產業的附屬品,需求驅動力薄弱,一旦擴產節奏超越需求復甦,週期性崩價便如期而至。

但 HBM 的需求,已被 AI 推理架構的物理邏輯鎖定在指數成長的軌道之上。這與 AI 整體市場的冷熱與總體經濟的景氣循環,都不存在直接的因果關係。

當然,真正的問題並不在需求端,而在供應端:SK 海力士、三星與美光這三大玩家,在面對強勁需求時,能否克制過去幾十年間反覆上演的盲目擴產衝動,避免再度埋下供過於求的週期禍根?這個問題的答案將會是本輪記憶體週期,能否長期延續的關鍵變數。

(記憶體股崩跌還能買嗎?三星證券分析師:週期內修正而非景氣見頂)

這篇文章 打破週期性迷思!一公式拆解 HBM 需求結構:記憶體為何只會繼續上漲? 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Applied Digital 取得 3 億美元橋接融資,由高盛牽頭,用於 AI 資料中心

根據 Globenewswire,Applied Digital 於 5 月 4 日透過由 Goldman Sachs 領導的優先有擔保橋式融資取得 3 億美元,以推進其 AI 資料中心開發。該融資以專案資產作為擔保,且可不受罰金提前償還,該公司計劃繼續推進

GateNews9分鐘前

SOL 策略收購跨鏈聚合器 HoudiniSwap,金額為 1800 萬美元

根據 The Block,納斯達克上市的 Solana 生態系資產庫公司 SOL Strategies 宣布與 HoudiniSwap 的確定性收購協議,收購金額為 1,800 萬美元。付款結構包括 825 萬美元現金、575 萬美元的六個月本票,以及 400 萬美元的 STKE 股票

GateNews29分鐘前

美國證券交易委員會延後核准本週原定的 20+ 預測市場 ETF

根據 Odaily,SEC 延遲了原本預計本週推出的超過 20 檔預測市場 ETF 的核准,要求發行人提供更多產品細節與揭露事項。該等申請由 Roundhill Investments、GraniteShares 和 Bitwise Asset Manag 在 2 月提交。

GateNews38分鐘前

策略在週二財報前暫停比特幣買入

Michael Saylor 表示,該策略將在週二公司公布財報前暫停比特幣採購,並於下週恢復買入。此次暫停發生之際,分析師正針對該公司的虧損以及其偏好股資金籌措的複雜性進行審視

GateNews1小時前

比特幣金庫公司 K Wave Media 爭取最多 $485M 用於 AI 基礎設施佈署

根據 ChainCatcher 報導,納斯達克上市的比特幣金庫公司 K Wave Media 於 5 月 4 日宣布進行戰略轉型,轉向 AI 基礎設施,為資料中心投資、GPU 租賃服務,以及 AI 基礎設施的收購與合作,取得最高 4.85 億美元的資本支持。 該公司

GateNews1小時前

摩根士丹利將標普 500 獲利預測上調至 4%,因科技業獲利強勁

根據摩根士丹利策略師 Michael Wilson 在 5 月 4 日的說法,美國強勁的企業獲利,特別是來自科技產業,正在抵消人們對中東衝突可能影響股市的擔憂。Michael Wilson 的團隊表示,S&P 500 的獲利預期已在全盤調升

GateNews2小時前
留言
0/400
暫無留言