🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
#OpenAIReleasesGPT-5.5
代理智能AI时代已经开始
2026年4月23日,OpenAI宣布向所有付费用户发布“GPT-5.5”。内部代号“Spud”,这个版本以其“代理”架构脱颖而出,不仅能聊天,还能规划和完成从开始到结束的指定目标。此次发布仅在Anthropic的Mythos模型一周后,显示出2026年的AI竞赛已进入更高的阶段。
什么是GPT-5.5,它能做什么?
OpenAI将GPT-5.5描述为“用于实际工作的新一类智能”。与之前的版本不同,该模型在模糊的多步骤任务上可以直接推进,无需用户逐步指导。它会规划、使用工具、检查自己的工作、在需要时运行代码、创建文档、进行在线研究,并在不同应用之间切换。
OpenAI联合创始人Greg Brockman总结了该模型的定位:“这不是一次渐进式更新,而是一类全新的智能。这是迈向更具代理性和直觉计算的重要一步。”
编码和计算机使用方面的突破
GPT-5.5在代理编码和计算机操作方面实现了最大飞跃。
• Terminal-Bench 2.0:在测试复杂命令行工作流程的基准测试中,准确率达到82.7% — 创下新纪录。 • SWE-Bench Pro:在衡量实际GitHub问题解决能力的测试中,得分为58.6%,在一次通行中解决了比以往模型更多的任务。 • OSWorld-Verified:在衡量模型是否能自主操作计算机的基准测试中,达到了78.7%。GPT-5.4得分75%,Anthropic的Opus 4.7得分78%。
它在使用更少的tokens的情况下完成了所有这些。根据Artificial Analysis的编码指数,GPT-5.5以大约一半的成本提供了前沿水平的智能。
谁可以使用,价格如何?
GPT-5.5在发布当天面向ChatGPT Plus、Pro、Business和Enterprise用户上线。API访问于4月24日开放。还提供一个更大的“GPT-5.5 Pro”版本,适用于每月100美元的Pro计划和企业账户。
目前免费层用户尚未开放访问。OpenAI表示,由于需要“不同的安全措施”,API的开放延迟了一天。
为什么叫“Spud”?开发过程
该模型的代号为“Spud”。预训练于2026年3月完成。Sam Altman向员工描述该模型为“一个非常强大的模型,实际上可以加快经济发展。”Greg Brockman表示Spud是“两年研究的产物”,代表着“不是一个渐进的步骤,而是在模型开发思路上的重大转变。”
企业应用:声称节省10小时
拥有早期访问权限的团队报告称,他们可以审查数千份额外的文档,发现快速编写代码中的错误,并每周节省最多10小时的工作时间。该模型在办公任务中表现出色,如创建文档、电子表格、演示文稿、数据分析和运行软件。
竞争:与Anthropic和Google的评分对比
GPT-5.5在编码基准测试中优于Anthropic的Opus 4.7和Google的Gemini 3.1 Pro。尤其在代理任务方面表现出色——需要多步骤规划和工具使用的场景。与GPT-5.4相比,它被定位为“更快、更敏锐的思考者,使用更少的tokens。”
安全与“代理性”风险
OpenAI表示,GPT-5.5是迈向“无需人类指导即可在计算机上完成复杂多步骤任务的AI系统”的第一步。因此,该模型被定义为“代理AI”,配备了更严格的安全保护措施。公司强调,该模型可以自行纠错并应对模糊性。
未来:GPT-6即将到来
行业消息人士认为,GPT-5.5是通向GPT-6的桥梁,后者预计将带来“无限上下文”、先进的内存管理和新的代理模式。还有传闻称OpenAI正在开发一个集成ChatGPT、Codex和Atlas浏览器的“超级应用”。
总结:#OpenAIReleasesGPT-5.5 标志着AI从“问答”阶段向“端到端完成任务”阶段的转变。凭借82.7%的Terminal-Bench得分、以半价实现的前沿性能,以及每周节省10小时的承诺,GPT-5.5在编码、研究和企业自动化方面树立了新标准。代理时代正式开启,竞争不再仅仅依赖“更好的答案”,而是“完成更多工作”。