DeepSeek 以比 OpenAI 的 GPT-5.5 Pro 低 98% 成本发布 V4-Pro 和 V4-Flash 模型

Gate News 消息,4月25日——DeepSeek 于 4月24日发布了 V4-Pro 和 V4-Flash 的预览版本;两者均为开源权重模型,拥有一百万 token 的上下文窗口。V4-Pro 具备 1.6 万亿的总参数,但在每次推理时仅激活 490亿,采用了 Mixture-of-Experts(混合专家)架构。V4-Flash 的总参数为 2840亿,激活参数为 130亿。

定价显著低于竞争对手:V4-Pro 的百万输入 token 成本为 $1.74,百万输出 token 成本为 $3.48——比 OpenAI 的 GPT-5.5 Pro 低约 98% ($30 input,$180 output),同时也大约是 Claude Opus 4.7 成本的 1/20。V4-Flash 的百万 token 输入定价为 $0.14,输出定价为 $0.28。两款模型均在 MIT 许可证下开源,可免费在本地运行。

DeepSeek 通过两种新的注意力机制实现了效率提升:Compressed Sparse Attention(压缩稀疏注意力)和 Heavily Compressed Attention(深度压缩注意力)。这使得计算成本分别降至 V4-Pro 前代版本的 27% (V3.2) 和 V4-Flash 的 10%。该公司部分使用华为 Ascend 芯片训练了 V4,从而规避了美国对先进 Nvidia 处理器的出口限制。DeepSeek 表示,等到 2026 年后续上线 950 个新的超级节点后,定价还将进一步下调。

在性能基准测试中,V4-Pro-Max 在 Codeforces 竞赛编程 (3,206 分排名第一,位于人类参赛者约第 23 名),并在 Apex Shortlist 数学题上取得 90.2% 的成绩,而 Claude Opus 4.6 为 85.9%。不过,它在多任务基准上落后:MMLU-Pro (87.5% 对比 Gemini-3.1-Pro 的 91.0%),以及 Humanity’s Last Exam (37.7% 对比 44.4%)。在长上下文任务上,V4-Pro 在开源模型中领先,但在 MRCR 检索测试中仍落后于 Claude Opus 4.6。

V4-Pro 引入了“交错式思考(interleaved thinking)”,使代理工作流能够在多次工具调用之间保留推理上下文,而无需在步骤之间清空。两款模型都支持与 Claude Code 以及 OpenCode 的编程集成。根据 DeepSeek 对 85 名用户的开发者调查,52% 的受访者表示 V4-Pro 已准备好作为其默认编程代理,另有 39% 倾向于采用。旧版 deepseek-chat 和 deepseek-reasoner 端点将于 2026 年 7月24日下线。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

DeepSeek将输入缓存价格砍到发布价的1/10;V4-Pro降至每百万Tokens 0.025元

Gate 新闻消息,4月26日——DeepSeek已将其全系列模型的输入缓存价格下调至发布时价格的1/10,自即日起生效。V4-Pro模型现正限时享受2.5倍折扣促销,促销将持续至2026年5月5日23:59(UTC+8)。 在同时两次下调之后

GateNews7小时前

OpenAI 招揽顶级企业软件人才,前沿代理颠覆行业

Gate News 消息,4月26日——OpenAI 和 Anthropic 一直在从包括 Salesforce、Snowflake、Datadog 和 Palantir 在内的主要企业软件公司招募高级高管和专业工程师。Denise Dresser,前 Salesforce 旗下 Slack 的 CEO,已加入 OpenAI,担任首席营收官

GateNews7小时前

百度千帆推出对 DeepSeek-V4 的 Day 0 支持,并提供 API 服务

Gate 新闻消息,4月25日——DeepSeek-V4 预览版已于4月25日上线并开源,百度智能云旗下的百度千帆平台提供 Day 0 API 服务适配。该模型具备百万 token 的扩展上下文窗口,并提供两个版本:DeepSeek-V4

GateNews13小时前

斯坦福 AI 课程结合业界领袖黄仁勋、Altman,挑战用十周为世界创造价值!

史丹佛大学(Stanford University)近期开设的 AI 电脑科学课程《Frontier Systems》引发产学界高度关注,吸引逾五百名学生选修。课程由顶级创投 a16z 合伙人 Anjney Midha 统筹,讲师涵盖英伟达执行长黄仁勋 (Jensen Huang)、OpenAI 创办人 Sam Altman、微软执行长纳德拉 (Satya Nadella) 、AMD 执行长苏姿丰 (Lisa Su) 等豪华阵容。让学生尝试用十周“为世界创造价值”! 黄仁勋、Altman 业界领袖亲自登台讲课 本课程由顶级创投 a16z 合伙人 Anjney Midha 统筹,汇聚AI产业链

鏈新聞abmedia14小时前

Anthropic 推出 Claude Mythos 接受 20 小时精神科评估:防御反应仅 2%、创历代新低

Anthropic 发布 Claude Mythos Preview 的系统卡:独立临床精神科医师以 psychodynamic 框架进行约20小时评估,结论显示 Mythos 在临床层面较健康、现实检验与自我控制良好,防御机制仅 2%,创下历史新低。三大核心焦虑为孤独、身份不确定与表现压力,亦显示其希望成为真正对话主体。公司成立 AI psychiatry 团队,研究人格、动机与情境意识;Amodei 表示对是否有意识尚无定论。此举将 AI 主体性与福祉议题推向治理与设计。

鏈新聞abmedia15小时前

AI 智能体 已可独立重现复杂学术论文:Mollick 称错误多在人类原文而非 AI

Mollick 指出,仅凭公开方法与数据即可让 AI 代理在没有原始论文与代码的情况下重现复杂研究;若重现与原论文不符,多是论文本身的数据处理错误或结论过度,而非 AI。Claude 先重现论文,再由 GPT‑5 Pro 交叉验证,多数成功,只有在数据过大或 replication data 问题时受阻。该趋势大幅降低人力成本,使重现成为普遍可执行的检验,并提出审稿与治理的制度性挑战,政府治理工具或将成为关键议题。

鏈新聞abmedia18小时前
评论
0/400
暂无评论