GPT-5.5 已到来,AI 竞赛再次加速



刚刚发生了什么
2026年4月23日,OpenAI 正式发布了代号“Spud”的 GPT-5.5,成为其迄今为止最强大、最智能的模型。此次发布正好是在 GPT-5.4 于3月5日推出六周后,以及竞争对手 Anthropic 发布其最新模型一周后。这个发布周期的速度并非偶然,而是当前前沿 AI 军备竞赛激烈升级的直接信号。OpenAI 总裁 Greg Brockman 将 GPT-5.5 描述为“新一类的智能”,以及“向更具代理性和直觉的计算迈出的一大步”。截至2026年4月24日,GPT-5.5 和 GPT-5.5 Pro 也已在 API 中上线,系统卡片已更新以包含额外的网络安全保障措施。这是历史上最快的 AI 发展周期,而 GPT-5.5 则是其最新的里程碑。

GPT-5.5 实际上有何不同
GPT-5.5 的核心突破不仅在于原始智能,更在于自主执行能力。以前的模型需要细致的逐步提示以避免错误,而 GPT-5.5 从根本上改变了这一点。你可以给它一个杂乱、多部分的任务,没有结构化指令,它会自主规划方案、选择合适的工具、检查自己的工作、应对模糊性,并持续推进直到任务完成。OpenAI 称这种“代理性”行为,模型表现得更像一个独立工作者,而非你手动操作的工具。

性能提升在四个领域尤为明显。在代理编码方面,GPT-5.5 在 Terminal-Bench 2.0 上得分82.7%,而 Anthropic 的 Claude Opus 4.7 仅为69.4%。在数学方面,GPT-5.5 Pro 在 FrontierMath Tier 4 的博士后级数学题中得分39.6%,几乎是 Claude Opus 4.7 的两倍(22.9%)。在计算机使用方面,模型能浏览软件、点击网页应用、截取屏幕截图,并反复迭代直到完成任务。在科学研究方面,GPT-5.5 已帮助研究人员发现了与 Ramsey 数相关的新数学证明,OpenAI 表示相信该模型确实能帮助专家科学家加速药物发现和基础研究。

除了原始分数外,GPT-5.5 在完成相同 Codex 任务时,使用的令牌明显少于 GPT-5.4,尽管价格更高,但成本效率更高。在实际服务中,它的每个令牌延迟与 GPT-5.4 相当,意味着在相同速度下拥有更多智能。特别是企业用户方面,纽约银行的首席信息官报告称,模型在抗幻觉方面有显著改善,这是受监管机构极为重视的关键需求。“我们看到这个模型带来了质的飞跃,”她在简报中确认。

两个版本:GPT-5.5 和 GPT-5.5 Pro
OpenAI 发布了两个不同层级的 GPT-5.5。标准版 GPT-5.5 通过 ChatGPT 和 Codex 向 Plus、Pro、Business 和 Enterprise 订阅者提供,在编码、计算机使用、知识工作和文档创建方面表现出色。GPT-5.5 Pro 在商业、法律、教育和数据科学等用例中提供更大幅度的质量提升,仅对 Pro、Business 和 Enterprise 订阅者开放。API 方面,自4月24日上线的 GPT-5.5,价格为每百万输入令牌$5 ,每百万输出令牌$30 。GPT-5.5 Pro 的价格为每百万输入令牌$30 ,每百万输出令牌$180 。批量和弹性定价为标准价的一半。优先处理费用为标准价的2.5倍。两个版本的1百万令牌上下文窗口保持一致。

OpenAI 当前的数字表现
GPT-5.5 的发布伴随着一组平台统计数据,OpenAI 明确希望市场关注。ChatGPT 现拥有超过9亿的每周活跃用户。平台上有超过5000万付费订阅者。企业部门已达900万付费企业用户。OpenAI 的 AI 编码助手 Codex 拥有400万活跃用户。这些数字很重要,因为近期一直有一种说法,认为 OpenAI 在企业市场上逐渐失势,被 Anthropic 超越。GPT-5.5 的推出,结合这些用户数据,是 OpenAI 对这一说法的直接反击。

Anthropic 竞争对手:谁在领先
在2026年4月,OpenAI 和 Anthropic 之间的竞争变得前所未有的激烈和明显。Anthropic 在 GPT-5.5 发布前一周推出了 Claude Opus 4.7。OpenAI 七天后回应,推出一款在大多数测试基准中优于 Claude Opus 4.7 的模型。在新闻发布会上,记者直接询问 GPT-5.5 是否会匹配 Anthropic 最近因未经授权访问而引发争议的 Mythos 高级网络安全模型。OpenAI 研究副总裁 Mia Glaese 表示,公司拥有强大且持久的网络安全战略,GPT-5.5 反映了数月的迭代优化,特别是在网络安全框架方面。

OpenAI 展示的基准对比显示,GPT-5.5 在大多数测试类别中持续优于 Claude Opus 4.7。然而,值得注意的是,受控环境中的基准表现并不总能直接转化为实际工作流程中的优势,企业客户通常会在做出模型选择前进行内部评估。竞赛实际上非常激烈,双方都没有绝对且永久的领先。

GPT-5.5 对 AI 经济意味着什么
OpenAI 总裁 Greg Brockman 在简报中发表的声明值得关注,超越了技术参数。“我们正迈向一个由计算驱动的经济体,”他说,认为 AI 计算能力和基础设施将成为未来经济活动的基石。GPT-5.5 正是朝这个愿景迈出的具体一步。该模型内部优化了 OpenAI 自己的 GPU 基础设施管理软件,开发出更高效的批处理算法,将令牌生成速度提升超过20%。这是一种在基础设施层面实现的递归自我改进,对长远发展具有重大影响。

Nvidia 在此故事中的作用同样重要。GPT-5.5 在 Nvidia 的 GB200 和 GB300 NVL72 系统上训练,这些系统配备了 Blackwell B200 和 Blackwell Ultra GPU。Nvidia 确认其最新芯片将运行像 GPT-5.5 这样先进 AI 模型的成本降低了最多35倍。对于加密和科技投资社区,这确认了持续的论点:AI 计算基础设施,特别是 Nvidia 的芯片生态系统,仍然是全球科技经济中最有价值的基础层。

安全性及 OpenAI 这次的不同之处
GPT-5.5 发布时,OpenAI 称其安全保障框架是迄今最强的。近200个可信的早期访问合作伙伴在正式发布前测试了实际用例。内部和外部的红队测试专门针对先进的网络安全和生物学能力。API 部署比 ChatGPT 消费者版本增加了额外的安全措施,因此在主发布后,API 访问最初延迟了一天。OpenAI 对 GPT-5.5 的安全策略反映了行业普遍的转变,即将安全测试作为发布前的必要条件,而非事后考虑,尤其是在模型具备自主多步骤行动能力的情况下。

普通用户和企业的意义
对于 Plus 及以上计划的个人用户,GPT-5.5 意味着完成复杂任务所需的提示更少。早期团队报告称,使用 GPT-5.5 进行代码核查、审查大量文档和自主处理多步骤研究任务,每周节省最多10小时的工作时间。对于企业团队,改进的抗幻觉能力、更好的代码调试、扩展的浏览器使用以及自主操作软件的能力,真正带来了生产力的提升。对于开发者而言,结合1百万令牌的上下文窗口、增强的代理性能和具有竞争力的价格,GPT-5.5 成为目前最强大的基础模型,适合构建 AI 驱动的应用。

最终结论
GPT-5.5 不是一个微小的增量更新,而是在自主能力、效率和在实际企业环境中的表现方面实现的质变。GPT-5.4 和 GPT-5.5 之间六周的发布周期,表明 OpenAI 承诺在2026年保持高速发展。AI 竞赛不再仅仅是哪个公司在实验室里打造出最聪明的模型,而是哪个平台能最深刻地融入人们和企业的日常工作。GPT-5.5 是 OpenAI 在实现这一目标方面最强有力的推动。
查看原文
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
内容包含 AI 生成部分
  • 赞赏
  • 4
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
ybaser
· 14 分钟前
2026 加油 👊
查看原文回复0
ybaser
· 14 分钟前
直达月球 🌕
查看原文回复0
AylaShinex
· 1小时前
直达月球 🌕
查看原文回复0
AylaShinex
· 1小时前
2026 GOGOGO 👊
回复0