News | Gate.com

2026-04-24

04:49

DeepSeek V4 在 Putnam-2025 上取得满分成绩，与 Axiom 在形式化数学推理中并列第一

Gate News 消息，4月24日——DeepSeek V4 已发布来自形式化数学推理评测的结果，在 Putnam-2025 上获得满分 120/120，与 Axiom 并列第一。在使用 LeanExplore 和受约束采样的实际模式下，V4-Flash-Max 在 Putnam-200 Pass@8 基准测试中得分 81.00，显著优于 Seed-2.0-Prover 35.50、Gemini 3 Pro 26.50 和 Seed-1.5-Prover 26.50。前沿模式的结果显示，V4 在 Seed-1.5-Prover 110/120 与 Aristotle 100/120 之前。 V4 采用混合的形式化-非形式化推理方法：非形式化推理生成候选自然语言解答，自我验证用于筛选结果，而形式化智能体在 Lean 中完成严格证明。前沿结果采用了大规模计算扩展，而实际模式分数更能反映标准部署能力。

展开

06:25

字节跳动 Seed 团队发布 Seed3D 2.0：增强几何精度与材质生成能力

AI 工具应用

快讯，4月23日——字节跳动的 Seed 团队发布了 Seed3D 2.0，这是一种从单张图像生成带纹理的 3D 资产的文本到 3D 模型。此次升级重点在于几何精度和材质真实感，API 现已在 Volcano Ark 上提供。几何生成采用

展开

07:05

Anthropic 移除 Claude Code 引发开发者强烈反弹；OpenAI 获得社区支持

AI 行业动态

Anthropic 将 Claude Code 从 Pro 计划中移除，引发批评，开发者开始迁移到 OpenAI；Codex 仍保持免费/基础，GPT-5.4 和 Image 2.0 提升性能，推动大规模用户迁移。摘要：本文考察了 Anthropic 将 Claude Code 从 $20 Pro 计划中移除的情况，这一举措引发了开发者的反弹，他们称这是一次隐藏的涨价，并且带来可靠性风险。文章将这一动作与 OpenAI 将 Codex 保留在免费和基础档位的政策进行对比，同时强调 GPT-5.4 和 ChatGPT Images 2.0 的强劲模型表现，并指出用户向 OpenAI 的快速迁移；据称 Codex 的每周活跃用户已超过 400 万。

展开

23:49

OpenAI 推出具备思考能力的 ChatGPT Images 2.0

AI 行业动态

OpenAI 推出带有更佳渲染效果的 ChatGPT Images 2.0，支持多语言脚本、实时网页搜索，并且每条提示可生成多种输出，同时在精度和定价基准方面也相较 Imagen 进行了完善。摘要：本文报道了 OpenAI 推出 ChatGPT Images 2.0，指出其对文字和界面元素的渲染得到改进，对语言支持更广泛，并且对指令的遵循程度更高。文章还描述了用于实时搜索、多输出以及输出精炼的新能力，同时提供了定价背景，并提到其架构仍未披露。

展开

12:22