2026-04-24 21:27:25

#OpenAIReleasesGPT-5.5

代理智能AI时代已经开始
2026年4月23日，OpenAI宣布向所有付费用户发布“GPT-5.5”。内部代号“Spud”，这个版本以其“代理”架构脱颖而出，不仅能聊天，还能规划和完成从开始到结束的指定目标。此次发布仅在Anthropic的Mythos模型一周后，显示出2026年的AI竞赛已进入更高的阶段。
什么是GPT-5.5，它能做什么？
OpenAI将GPT-5.5描述为“用于实际工作的新一类智能”。与之前的版本不同，该模型在模糊的多步骤任务上可以直接推进，无需用户逐步指导。它会规划、使用工具、检查自己的工作、在需要时运行代码、创建文档、进行在线研究，并在不同应用之间切换。

OpenAI联合创始人Greg Brockman总结了该模型的定位：“这不是一次渐进式更新，而是一类全新的智能。这是迈向更具代理性和直觉计算的重要一步。”
编码和计算机使用方面的突破
GPT-5.5在代理编码和计算机操作方面实现了最大飞跃。
• Terminal-Bench 2.0：在测试复杂命令行工作流程的基准测试中，准确率达到82.7% — 创下新纪录。 • SWE-Bench Pro：在衡量实际GitHub问题解决能力的测试中，得分为58.6%，在一次通行中解决了比以往模型更多的任务。 • OSWorld-Verified：在衡量模型是否能自主操作计算机的基准测试中，达到了78.7%。GPT-5.4得分75%，Anthropic的Opus 4.7得分78%。
它在使用更少的tokens的情况下完成了所有这些。根据Artificial Analysis的编码指数，GPT-5.5以大约一半的成本提供了前沿水平的智能。
谁可以使用，价格如何？
GPT-5.5在发布当天面向ChatGPT Plus、Pro、Business和Enterprise用户上线。API访问于4月24日开放。还提供一个更大的“GPT-5.5 Pro”版本，适用于每月100美元的Pro计划和企业账户。

目前免费层用户尚未开放访问。OpenAI表示，由于需要“不同的安全措施”，API的开放延迟了一天。
为什么叫“Spud”？开发过程
该模型的代号为“Spud”。预训练于2026年3月完成。Sam Altman向员工描述该模型为“一个非常强大的模型，实际上可以加快经济发展。”Greg Brockman表示Spud是“两年研究的产物”，代表着“不是一个渐进的步骤，而是在模型开发思路上的重大转变。”
企业应用：声称节省10小时
拥有早期访问权限的团队报告称，他们可以审查数千份额外的文档，发现快速编写代码中的错误，并每周节省最多10小时的工作时间。该模型在办公任务中表现出色，如创建文档、电子表格、演示文稿、数据分析和运行软件。
竞争：与Anthropic和Google的评分对比
GPT-5.5在编码基准测试中优于Anthropic的Opus 4.7和Google的Gemini 3.1 Pro。尤其在代理任务方面表现出色——需要多步骤规划和工具使用的场景。与GPT-5.4相比，它被定位为“更快、更敏锐的思考者，使用更少的tokens。”
安全与“代理性”风险
OpenAI表示，GPT-5.5是迈向“无需人类指导即可在计算机上完成复杂多步骤任务的AI系统”的第一步。因此，该模型被定义为“代理AI”，配备了更严格的安全保护措施。公司强调，该模型可以自行纠错并应对模糊性。
未来：GPT-6即将到来
行业消息人士认为，GPT-5.5是通向GPT-6的桥梁，后者预计将带来“无限上下文”、先进的内存管理和新的代理模式。还有传闻称OpenAI正在开发一个集成ChatGPT、Codex和Atlas浏览器的“超级应用”。
总结：#OpenAIReleasesGPT-5.5 标志着AI从“问答”阶段向“端到端完成任务”阶段的转变。凭借82.7%的Terminal-Bench得分、以半价实现的前沿性能，以及每周节省10小时的承诺，GPT-5.5在编码、研究和企业自动化方面树立了新标准。代理时代正式开启，竞争不再仅仅依赖“更好的答案”，而是“完成更多工作”。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

8人点赞了这条动态

赞赏
8
12
转发
分享

请输入评论内容

CryptoShadow

· 16 分钟前

2026 GOGOGO 👊

CryptoShadow

· 16 分钟前

直达月球 🌕

查看原文回复0

ybaser

· 39 分钟前

直达月球 🌕

查看原文回复0

ChuDevil

· 1小时前

冲冲GT 🚀

ChuDevil

· 1小时前

快上车！🚗

ChuDevil

· 1小时前

冲就完了 👊

Ryakpanda

· 2小时前

冲就完了 👊

Seyyidetünnisa

· 4小时前

直达月球 🌕

查看原文回复0

Seyyidetünnisa

· 4小时前

2026 GOGOGO 👊

User_any

· 4小时前

LFG 🔥

热门话题
查看更多
#
WCTC交易王PK
17.55万热度
#
加密市场行情震荡
23.76万热度
#
rsETH攻击事件后续进展
7.76万热度
#
美伊谈判陷入僵局
19.08万热度
#
ETH链Meme币FLORK拉升
4.17万热度

#OpenAIReleasesGPT-5.5

热门话题

WCTC交易王PK

加密市场行情震荡

rsETH攻击事件后续进展

美伊谈判陷入僵局

ETH链Meme币FLORK拉升

置顶