Google 新技術嚇壞市場,AI 記憶體需求少六倍!SK 海力士、美光同步下殺

鏈新聞abmedia

Google 推出 TurboQuant 演算法,將大型語言模型的記憶體占用壓縮至少 6 倍,同時在不犧牲模型準確率的前提下,將推理運算速度提升最高達 8 倍 。市場迅速將這項技術解讀為「需求側破壞」,背後邏輯相當直接:若 AI 模型在推理階段對記憶體的需求被壓縮數倍,意味著未來資料中心對 DRAM、HBM 甚至 NAND 儲存的需求成長曲線,可能出現結構性下修。

在消息釋出後,記憶體與儲存相關個股出現同步下跌,包括 SanDisk(SNDK)下跌 3.5%、Micron Technology(MU)下跌 3.4%、Western Digital(WDC)下跌 1.63%;亞洲供應鏈方面,Samsung Electronics 下跌 4.71%,SK Hynix 跌幅更達 6.23%。也有觀點認為,TurboQuant 更可能改變的是「資源使用效率」,而非單純削弱需求。

Google 最新演算法:記憶體用量少六倍、推理速度快八倍

根據 Google 研究團隊說明,TurboQuant 是一套針對大型語言模型與向量搜尋系統設計的量化(quantization)演算法,核心在於大幅壓縮 AI 模型中最吃資源的「key-value cache」與高維向量資料結構。在測試中,該技術可將記憶體占用壓縮至少 6 倍,同時在不犧牲模型準確率的前提下,將推理運算速度提升最高達 8 倍 。

(輝達 Vera Rubin 有何改變?解析記憶體戰國時代:SK 海力士、三星、美光、SanDisk)

這項突破直接命中當前 AI 基礎設施的關鍵瓶頸。生成式 AI 在算力層的擴展,高度依賴 HBM 等高頻寬記憶體,以承載模型權重與大規模 KV cache,避免推理過程記憶體卡死。然而 TurboQuant 透過結合 PolarQuant 與 Quantized Johnson-Lindenstrauss(QJL)等方法,在幾乎「零額外記憶體開銷」下完成壓縮,等同於用更少硬體資源完成同樣甚至更高效的運算。

Googlie 演算法衝擊記憶體!美韓記憶體廠普跌

市場迅速將這項技術解讀為「需求側破壞」。在消息釋出後,記憶體與儲存相關個股出現同步下跌,包括 SanDisk(SNDK)下跌 3.5%、Micron Technology(MU)下跌 3.4%、Western Digital(WDC)下跌 1.63%;亞洲供應鏈方面,Samsung Electronics 下跌 4.71%,SK Hynix 跌幅更達 6.23%。

背後邏輯相當直接:若 AI 模型在推理階段對記憶體的需求被壓縮數倍,意味著未來資料中心對 DRAM、HBM 甚至 NAND 儲存的需求成長曲線,可能出現結構性下修。特別是在 AI 產業逐步從「訓練導向」轉向「推理導向」的背景下,效率優化技術的邊際影響將被放大。

不過,也有觀點認為,TurboQuant 更可能改變的是「資源使用效率」,而非單純削弱需求。隨著成本下降與延遲降低,AI 應用場景反而可能進一步擴張,進而帶動總體算力需求持續成長,形成「單位需求下降、總量需求上升」的結構。大型記憶體廠今年的產能都已售完,或許市場要想的是:AI 成長的天花板,究竟有多大?

這篇文章 Google 新技術嚇壞市場,AI 記憶體需求少六倍!SK 海力士、美光同步下殺 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明
留言
0/400
暫無留言