DeepSeek V4 引爆美國辯論:智庫質疑晶片使用,Replit 執行長為開放創新辯護
Gate News 訊息,4 月 24 日——美國就 DeepSeek V4 的技術能力與合規性引發了爭論。Chris McGuire,外交關係委員會 (CFR) 的資深研究員,以及曾任白宮國家安全委員會與國防部官員,發表了分析,主張 V4 並未改變美中 AI 的競爭格局。據 McGuire 稱,DeepSeek 自己的 V4 報告承認,其推理能力較前沿模型落後約 3 到 6 個月,基準測試對標的是六個月前發布的 GPT-5.2 與 Gemini 3.0 Pro。
McGuire 對此表示擔憂:雖然 V4 報告披露了在推論階段對 NVIDIA GPU 與 Huawei Ascend NPU 的適配,但並未公開指定開發期間使用的 GPU 型號或訓練成本。他質疑這種沉默是否意味著使用了受出口管制的 NVIDIA Blackwell 晶片,並指出 V3 先前曾聲稱使用了 2,000 張 H800 GPU,成本為 5.57 百萬美元。DeepSeek 已否認使用 Blackwell,稱該模型是在 NVIDIA H800 與 Huawei Ascend 910C 處理器上訓練。
Replit 執行長 Amjad Masad 反駁了 McGuire 的分析,認為中國科學家正在公開分享真正的 AI 突破,而美國的政策制定者與遊說者則放大了「中國蒸餾」的疑慮。Masad 強調 DeepSeek 官方表述中披露的架構創新,包括令牌級注意力壓縮 DeepSeek Sparse Attention 以及用於長上下文運算的顯著效率提升。他指出,V4-Pro 相較於 V3.2,在 1M 上下文長度下展現了大幅更低的每令牌推論運算量與 KV 快取需求,並強調這些架構進展與訓練資料蒸餾無關,而且所有研究人員(包括美國的實驗室)都能從開源發展中受益。