DeepSeek V4 以 1M 上下文窗口发布;华为 Ascend 与寒武纪芯片实现全面兼容

Gate News 消息,4月24日——DeepSeek V4-Pro 和 DeepSeek V4-Flash 于 4 月 24 日正式发布,并开源发布;上下文处理长度从 128K 大幅扩展至 1M,容量提升接近 10 倍。华为计算宣布其 Ascend 超算节点产品通过芯片与模型技术的紧密协作,全面支持 DeepSeek V4 系列模型。

华为 Ascend 950 通过融合算子内核与多流并行等技术,实现高吞吐、低时延的 DeepSeek V4 模型推理部署,以降低 Attention 计算及内存访问开销。对于输入 8K 的 DeepSeek V4-Pro,Ascend 950 实现约 20ms TPOT,单卡 Decode 吞吐达 4,700 TPS;对于输入低于 8K 的 DeepSeek V4-Flash,吞吐可达约 10ms TPOT、1,600 TPS。Ascend A3 超算节点系列同样实现全面兼容,并提供训练参考实现以便快速微调。基于采用大 EP 模式的 Ascend A3 64 卡超算节点,使用 vLLM 推理引擎,DeepSeek V4-Flash 在 8K/1K 输入输出场景下实现单卡 Decode 吞吐超过 2,000 TPS。华为全线 Ascend A2、A3 和 950 产品均支持 DeepSeek V4-Flash 与 V4-Pro。

华为云宣布与 DeepSeek V4 的“先发兼容”,通过其 MaaS 平台为开发者提供一键式 API Token 服务。华为云优化系统层、算子层和集群层能力,确保模型快速适配与高性能部署。包括金山 WPS 和 360 在内的企业已通过华为云集成了 DeepSeek 的新模型。

寒武纪同样宣布基于 vLLM 推理框架的 DeepSeek V4-Flash 与 V4-Pro Day 0 兼容性,并将适配代码开源至 GitHub 社区。寒武纪此前在去年 DeepSeek V3.2 发布时也实现了“先发适配”,在 DeepSeek 系列模型上开展了深度的软件-硬件协同性能优化。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

印度在班加罗尔启动 $650M AI 城市项目,目标到 2030 年吸引 25,000 名研究人员

Gate News 消息,4月27日——印度正在班加罗尔开发一个 $650 百万美元的 AI 城市,配备一座占地 500,000 平方英尺的设施,旨在成为全球首个用于代理式 AI 的实体实验室。该项目为四家主要 AI 云服务提供商提供 400 Gbps 的连接,并计划在

GateNews9 分钟前

Sam Altman 阐述 OpenAI 的五项运营原则,暗示为安全可能实施的未来模型能力限制

Gate News 消息,4月27日——OpenAI 首席执行官 Sam Altman 以其个人署名发布了公司五项运营原则,表明 OpenAI 可能会在某些时期限制用户访问模型能力,以优先考虑安全。在声明中,Altman 描述了一个潜在的未来情景,即公司需要“在牺牲部分赋能以换取更强韧性”的情况下推进。

GateNews1小时前

DeepSeek 延迟 V4 推出 以优化适配华为的昇腾芯片

Gate News 消息,4月27日——DeepSeek 推迟了其 V4 模型的发布,以便对其软件堆栈进行微调以适配华为的昇腾芯片,反映出北京更广泛的举措:随着对先进外国半导体的获取日益受限,推动建设本土 AI 供应链。 DeepSe

GateNews1小时前

DeepSeek将输入缓存价格砍到发布价的1/10;V4-Pro降至每百万Tokens 0.025元

Gate 新闻消息,4月26日——DeepSeek已将其全系列模型的输入缓存价格下调至发布时价格的1/10,自即日起生效。V4-Pro模型现正限时享受2.5倍折扣促销,促销将持续至2026年5月5日23:59(UTC+8)。 在同时两次下调之后

GateNews11小时前

OpenAI 招揽顶级企业软件人才,前沿代理颠覆行业

Gate News 消息,4月26日——OpenAI 和 Anthropic 一直在从包括 Salesforce、Snowflake、Datadog 和 Palantir 在内的主要企业软件公司招募高级高管和专业工程师。Denise Dresser,前 Salesforce 旗下 Slack 的 CEO,已加入 OpenAI,担任首席营收官

GateNews11小时前

百度千帆推出对 DeepSeek-V4 的 Day 0 支持,并提供 API 服务

Gate 新闻消息,4月25日——DeepSeek-V4 预览版已于4月25日上线并开源,百度智能云旗下的百度千帆平台提供 Day 0 API 服务适配。该模型具备百万 token 的扩展上下文窗口,并提供两个版本:DeepSeek-V4

GateNews17小时前
评论
0/400
暂无评论