"BONK 2.0"的搜索结果
2026-04-24
04:49

DeepSeek V4 在 Putnam-2025 上取得满分成绩,与 Axiom 在形式化数学推理中并列第一

Gate News 消息,4月24日——DeepSeek V4 已发布来自形式化数学推理评测的结果,在 Putnam-2025 上获得满分 120/120,与 Axiom 并列第一。 在使用 LeanExplore 和受约束采样的实际模式下,V4-Flash-Max 在 Putnam-200 Pass@8 基准测试中得分 81.00,显著优于 Seed-2.0-Prover 35.50、Gemini 3 Pro 26.50 和 Seed-1.5-Prover 26.50。前沿模式的结果显示,V4 在 Seed-1.5-Prover 110/120 与 Aristotle 100/120 之前。 V4 采用混合的形式化-非形式化推理方法:非形式化推理生成候选自然语言解答,自我验证用于筛选结果,而形式化智能体在 Lean 中完成严格证明。前沿结果采用了大规模计算扩展,而实际模式分数更能反映标准部署能力。
展开
07:05

Anthropic 移除 Claude Code 引发开发者强烈反弹;OpenAI 获得社区支持

Anthropic 将 Claude Code 从 Pro 计划中移除,引发批评,开发者开始迁移到 OpenAI;Codex 仍保持免费/基础,GPT-5.4 和 Image 2.0 提升性能,推动大规模用户迁移。 摘要:本文考察了 Anthropic 将 Claude Code 从 $20 Pro 计划中移除的情况,这一举措引发了开发者的反弹,他们称这是一次隐藏的涨价,并且带来可靠性风险。文章将这一动作与 OpenAI 将 Codex 保留在免费和基础档位的政策进行对比,同时强调 GPT-5.4 和 ChatGPT Images 2.0 的强劲模型表现,并指出用户向 OpenAI 的快速迁移;据称 Codex 的每周活跃用户已超过 400 万。
展开
23:49

OpenAI 推出具备思考能力的 ChatGPT Images 2.0

OpenAI 推出带有更佳渲染效果的 ChatGPT Images 2.0,支持多语言脚本、实时网页搜索,并且每条提示可生成多种输出,同时在精度和定价基准方面也相较 Imagen 进行了完善。 摘要:本文报道了 OpenAI 推出 ChatGPT Images 2.0,指出其对文字和界面元素的渲染得到改进,对语言支持更广泛,并且对指令的遵循程度更高。文章还描述了用于实时搜索、多输出以及输出精炼的新能力,同时提供了定价背景,并提到其架构仍未披露。
展开
06:29

World 推出 MiniKit 2.0,实现 Web 与 World App 跨平台开发

World 在 World Chain 上发布 MiniKit 2.0,提供标准化开发框架,实现跨平台应用简化部署,兼容以太坊 EIP-1193。新功能支持本地化支付,缩短交易确认时间,提升开发效率,并允许开发者代用户支付费用。该升级增强了用户参与度,并将于 EthCC 大会展示。
展开
ETH-0.68%