DeepSeek 開源 TileKernels:大型模型訓練與推理用 GPU Kernel 庫

Gate News 訊息,4 月 23 日 — DeepSeek 已在 MIT 許可證下開源 TileKernels,這是一個以 TileLang 編寫的 GPU kernel 庫,用於大型語言模型的訓練與推理。TileLang 是 tile-ai 團隊所開發的領域特定語言,用於在 Python 中表達高效能的 GPU kernel。DeepSeek 表示,該程式庫中的多數 kernel 已接近在運算密度與記憶體頻寬方面的硬體效能上限,其中部分已部署於內部的訓練與推理作業。

該程式庫包含六類 kernel:MoE (專家混合) 的 gating 與路由,包括 Top-k 專家選擇、token-to-expert 對映,以及帶權重正規化的融合 expand/shrink;支援量化的格式包含 FP8、FP4 與 E5M6,並提供逐 token、逐區塊與逐通道的量化,包含融合的 SwiGLU+量化運算;batch transpose;Engram gating,並融合 RMSNorm 前向/反向傳播與權重梯度歸約;Manifold HyperConnection,採用 Sinkhorn 正規化與混合的 split/apply;以及高階 autograd 介面,將低階 kernel 封裝為可訓練層。

Engram 與 Manifold HyperConnection 是 DeepSeek 模型架構的專有元件,實作細節首次向公眾公開。該程式庫需要 NVIDIA SM90 或 SM100 架構的 GPU (H100/H200 或 Blackwell 系列)、CUDA Toolkit 13.1 或更高版本,以及 PyTorch 2.10 或更高版本。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

MagicBlock 發布 Mirage:面向 Solana 的命令列隱私支付工具

Gate News 訊息,4月23日 — MagicBlock 已發布 Mirage,一款為 Solana 網路打造的命令列隱私支付工具。該工具讓使用者能夠透過終端機指令、機器人或 AI 代理來建立錢包、存入資金並發送私密交易。 Mirage 建置於 Private

GateNews27分鐘前

Aave 為降低系統性風險而在以太坊、Arbitrum 及其他網路暫停 rsETH 儲備運營

Gate 新聞消息,4 月 23 日 — Aave 宣布,為在資產回收流程期間降低系統性風險,它已在以太坊主網、Arbitrum、Base、Mantle 和 Linea 網路暫停所有與 rsETH 儲備相關的運營。 該措施旨在在回收計劃推進的同時,保留額外資金

GateNews37分鐘前

Morpho 協會將於未來幾週執行一系列錢包轉帳以進行資金管理

Gate 新聞訊息,4月23日——Morpho 協會將在未來幾週內,作為例行資金管理作業的一部分,從其協會擁有的錢包進行一系列轉帳。

GateNews1小時前

Circle 首席經濟學家提議在 KelpDAO 風波中上調 Aave 上的 USDC 利率

Gate 新聞訊息,4 月 23 日——Circle 首席經濟學家 Gordon Liao 本週在 Aave v3 Ethereum Core 上提議上調 USDC 貸款參數,原因是先前發生了一起 $292 百萬 KelpDAO rsETH 漏洞攻擊,導致整個協議出現流動性危機。Liao 的徵求意見(Request for Comment)建議將 "S

GateNews1小時前

ENS 公布 ENSv2:面向大規模整合與子網域擴展的新網域基礎設施

Gate News 訊息,4月23日 — ENS 宣布即將推出 ENSv2,一種新的網域基礎設施,旨在進行大規模整合並擴展子網域。 升級後的系統代表 ENS 下一代網域命名架構,打造用於在整個生態系中支援更廣泛的採用並提升可擴展性。

GateNews1小時前

MoonPay 在紐約推出以 Iron 驅動的虛擬帳戶,讓企業可進行受監管的穩定幣支付

Gate 新聞訊息,4月23日 — MoonPay 已宣布在紐約州推出由 Iron 技術驅動的虛擬帳戶,為金融科技公司、加密貨幣平台、數位銀行(neobanks)、券商與金融機構提供受監管的法幣到穩定幣的支付基礎設施。該服務 enable

GateNews2小時前
留言
0/400
暫無留言