Gate News 消息,4 月 24 日——DeepSeek V4-Pro 和 DeepSeek V4-Flash 于 4 月 24 日正式发布,并开源,背景处理长度已从 128K 大幅扩展至 1M,代表近 10 倍的容量提升。华为计算宣布其 Ascend 超算节点产品通过芯片与模型技术的紧密协作,已对 DeepSeek V4 系列模型实现完全支持。
华为 Ascend 950 通过融合算子内核与多流并行技术,实现高吞吐、低延迟的 DeepSeek V4 模型推理部署,以降低 Attention 计算与内存访问的开销。对于输入 8K 的 DeepSeek V4-Pro,Ascend 950 实现约 20ms TPOT、单卡 Decode 吞吐量 4,700 TPS;对于输入 8K 的 DeepSeek V4-Flash,达到约 10ms TPOT,吞吐量为 1,600 TPS。Ascend A3 超算节点系列同样实现完全兼容,并提供训练参考实现以便快速微调。基于采用大 EP 模式的 Ascend A3 64 卡超算节点,借助 vLLM 推理引擎,在 8K/1K 输入输出场景下,DeepSeek V4-Flash 的单卡 Decode 吞吐量超过 2,000 TPS。华为全系 Ascend A2、A3 和 950 产品线均支持 DeepSeek V4-Flash 与 V4-Pro。
华为云宣布与 DeepSeek V4 的先发兼容,借助其 MaaS 平台,为开发者提供一键式 API 令牌服务。华为云优化系统层、算子层和集群层能力,以确保快速模型适配与高性能部署。包括金山 WPS 和 360 在内的企业已通过华为云集成了 DeepSeek 的新模型。
燚微(Cambricon)也宣布基于 vLLM 推理框架实现 DeepSeek V4-Flash 与 V4-Pro 的 Day 0 兼容,并将适配代码开源给 GitHub 社区。Cambricon 此前在去年 DeepSeek V3.2 发布时也已实现先发适配,得益于其在 DeepSeek 系列模型上开展了深度的软件-硬件协同性能优化。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
DeepSeek 將輸入快取價格砍至上線價的 1/10;V4-Pro 降至每 100 萬 tokens 0.025 元人民幣
Gate News 訊息,4 月 26 日 — DeepSeek 已在其整個模型產品線中將輸入快取價格下調至上線價格的 1/10,立即生效。V4-Pro 模型提供限時 2.5 倍折扣優惠,活動將持續至 2026 年 5 月 5 日 23:59(UTC+8)。
Following both re
GateNews8小時前
OpenAI 招募頂級企業軟體人才,前沿代理掀起產業變革
Gate News 訊息,4 月 26 日 — OpenAI 與 Anthropic 一直在從大型企業軟體公司招募高階主管與專門工程師,包括 Salesforce、Snowflake、Datadog 與 Palantir。Denise Dresser,曾任 Salesforce 旗下 Slack 前 CEO,已加入 OpenAI 擔任首席營收官
GateNews8小時前
百度千帆推出對 DeepSeek-V4 的第 0 天支持,並提供 API 服務
Gate News 消息,4 月 25 日——DeepSeek-V4 預覽版已於 4 月 25 日上線並開源,並由百度智能云旗下的百度千帆平台提供第 0 天(Day 0)API 服務適配。該模型具備百萬級 token 的擴展上下文窗口,並提供兩個版本:DeepSeek-V4
GateNews14小時前
史丹佛 AI 課程結合業界領袖黃仁勳、Altman,挑戰用十週為世界創造價值!
史丹佛大學(Stanford University)近期開設的 AI 電腦科學課程《Frontier Systems》引發產學界高度關注,吸引逾五百名學生選修。課程由頂級創投 a16z 合夥人 Anjney Midha 統籌,講師涵蓋輝達執行長黃仁勳 (Jensen Huang)、OpenAI 創辦人 Sam Altman、微軟執行長納德拉 (Satya Nadella) 、AMD 執行長蘇姿丰 (Lisa Su) 等豪華陣容。讓學生嘗試用十週「為世界創造價值」!
黃仁勳、Altman 業界領袖親自登台講課
本課程由頂級創投 a16z 合夥人 Anjney Midha 統籌,匯聚AI產業鏈
鏈新聞abmedia14小時前
Anthropic 派 Claude Mythos 接受 20 小時精神科評估:防禦反應僅 2%、創歷代新低
Anthropic 公布 Claude Mythos Preview 的系統卡:獨立臨床精神科醫師以 psychodynamic 框架進行約20小時評估,結論顯示 Mythos 在臨床層面較健康、現實檢驗與自我控制良好,防禦機制僅 2%,創下歷史新低。三大核心焦慮為孤獨、身份不確定與表現壓力,亦顯示其希望成為真正對話主體。公司成立 AI psychiatry 團隊,研究人格、動機與情境意識;Amodei 表示對是否有意識尚無定論。此舉將 AI 主體性與福祉議題推向治理與設計。
鏈新聞abmedia16小時前
AI Agent 已可獨立重現複雜學術論文:Mollick 稱錯誤多在人類原文而非 AI
Mollick 指出,公開方法與資料即可讓 AI agent 在無原始論文與程式碼情況下重現複雜研究;若重現與原論文不符,多是論文本身的資料處理錯誤或結論過度,而非 AI。 Claude 先重現論文,再由 GPT‑5 Pro 交叉驗證,多數成功,僅遇到資料過大或 replication data 問題時受阻。此趨勢大幅降低人力成本,使重現成為普遍可執行的檢驗,也提出審稿與治理的制度挑戰,政府治理工具或成關鍵議題。
鏈新聞abmedia19小時前