OpenAI 週二正式發布 ChatGPT Images 2.0,不僅大幅提升文字生成的准确度、以及海报与人像上的设计美感。该模型也首次引入“思考模式”,让图像生成具备网络搜索与多图批量输出能力,向商业应用场景全面靠拢。
(Canva 宣布深度整合 Claude,实现将 AI 草稿转化为设计成品)
从凭空捏造到完美菜单:AI 终于学会拼字
回顾两年前,AI 图像生成模型在文字生成的弱点几乎人尽皆知,只要提示词中包含文字需求,输出结果往往充斥荒谬的拼写错误甚至是凭空捏造,在非英语的中日韩语言中更加严重。
官方公告的韩文海报示意图
如今,ChatGPT Images 2.0 已能生成一张可直接供业者使用的宣传海报,文字清晰准确。研究人员近年來积极探索自我回归模型 (Autoregressive Models) 等新架构,其其运作逻辑、对文字的理解、生成与验证能力显著提升。
思考模式上线:连网搜索、构图一致性统统到位
ChatGPT Images 2.0最核心的升级在于“思考模式 (Thinking Capabilities)”,目前向 ChatGPT Plus、Pro、商用版及企业版付费用户开放。启用后,模型可即时连网搜索资讯以辅助图像生成,也能根据用户上传的档案制作对应的可视化说明图,并在正式输出前对图像内容进行自我审查与优化。
在批量生成方面,思考模式下单一提示词最多可一次输出八张图像,且各图之间能维持一致的角色形象、物件样式与整体风格,适合用于漫画分镜、社群媒体系列图文,乃至室内设计的各空间规划图。
官方公告的漫画分镜示意图
解析度方面,新模型支持最高 2K 输出,并新增从 3:1 到 1:3 的多种长宽比选项,进一步满足各种商业需求。
亚洲语言大幅优化,中日韩用户有福了!
除英文外,OpenAI 特别指出 Images 2.0 在亚洲文字上的重大优化,日文、韩文与中文等均有明显改善。
几天前广为流传于中国科技社群的测试文章也验证了该消息,多位知乎创作者在当时进行 GPT-Image-2 与竞品 Google Nano Banana Pro 的实测比较,包括中文海报设计、电商封面图、社群媒体界面与数据化图表等多种场景。
知乎文章测试 GPT-Image 2.0
测试结果显示,GPT-Image-2 在中文字体现美感、排版层级与整体设计感上均明显胜出,生成的海报风格更接近真实商业素材,而非带有明显“AI 感”的模板式输出。文章同时指出,GPT-Image-2 在界面复刻 (如游戏画面或通讯软件截图) 与真实人像场景的还原上,也展现出更高的细节精确度。
ChatGPT Images 2.0 全面开放,API 同步上线
目前,ChatGPT Images 2.0 已自本週二起向所有 ChatGPT 及 Codex 用户免费提供基础功能,付费用户则可解锁更进阶的输出效果。与此同时,OpenAI 也同步开放 GPT-Image-2 API,定价依据输出品质与解析度分级计算,为企业端与开发者提供整合弹性。
值得注意的是,新模型的知识截止日期为 2025 年 12 月,对于涉及最新时事的图像生成提示词,准确度可能受到一定限制。此外,复杂构图的生成速度也无法像一般文字问答即时报,但仍仅需几分钟。
这篇文章 ChatGPT Images 2.0 登场!文字生成准确度大提升,轻松产出营销海报 最早出现于 鏈新闻 ABMedia。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Sam Altman 在播客中回应住所遭袭,并预测还会有类似事件
Gate News 消息,4 月 22 日——OpenAI 首席执行官 Sam Altman 在一次“Core Memory”播客露面期间,首次公开回应了针对其住所的两起袭击。Altman 表示,类似事件在未来很可能还会发生,尽管他没有详细说明袭击的具体情况
GateNews8 分钟前
上海完成1项生成式人工智能服务备案,累计总数达158
上海截至2026年4月21日报告新增1项已完成备案的生成式人工智能服务,使上海在临时措施下已登记的总数达到158项。
摘要:本简报指出,上海市网信办宣布,截至2026年4月21日,1项新的生成式人工智能服务已完成备案,使总数达到158项。此举是在《生成式人工智能服务管理临时措施》之后进行的,该措施要求提供方向监管机构进行备案。
GateNews9 分钟前
Hugging Face 开源 ml-intern:用于自主机器学习研究的 AI 代理
开源的 ml-intern:Hugging Face 的自主机器学习(ML)研究代理,它会阅读论文、整理数据、训练、评估,并在科学、医学和数学领域持续迭代。
摘要:Hugging Face 的 ml-intern 是一个开源的自主机器学习研究代理,能够阅读论文、整理数据集,在本地或云端 GPU 上进行训练、评估结果,并迭代改进。它基于 smolagents,提供 CLI 和网页界面,能够浏览 arXiv/HF Papers、HF Hub 和 HF Jobs。演示覆盖科学、医学和数学,展示端到端自动化以及性能提升。
GateNews24 分钟前
摩根大通将标普 500 年末目标上调至 7,600,称 AI 投资热潮高涨且地缘政治风险缓解
摘要:摩根大通上调 2026 年标普 500 至 7,600、2027 年至 385 EPS,受 AI 热情高涨以及中东紧张局势缓和推动;前瞻市盈率保持在 22x,若紧张局势缓和,存在上探至 23x 且约 8,000 的潜力;警告短期可能出现盘整,原因包括油价与地缘政治风险。
摘要:摩根大通战略团队,由 Dubravko Lakos-Bujas 领导,将年末标普 500 预测上调至 7,600(此前为 7,200),原因是 AI 热情重新升温以及中东紧张局势缓和。2026 年每股收益被 $330 并上调至 2027 年为 $385,前瞻倍数维持在 22x;若地缘政治更快得到解决,该倍数或可上调至 23x,并推动 2026 年接近 8,000。自 Anthropic 于此前发布 Mythos 之后,AI 主题获得动能,约有三分之二的与 AI 相关的标普 500 股票跑赢。风险包括油价走高以及持续的地缘政治紧张,表明在进一步上涨之前,短期可能出现盘整。
GateNews28 分钟前
OpenAI 向美国政府和“五眼”联盟简报网络安全产品
Gate News 消息,4月22日——据 Axios 报道,OpenAI 已就一款新的网络安全产品向美国联邦政府以及“五眼”联盟进行了简报。
GateNews38 分钟前