ChatGPT 图像 2.0 登场!文字生成准确度大提升,轻松产出营销海报

鏈新聞abmedia

OpenAI 週二正式發布 ChatGPT Images 2.0,不僅大幅提升文字生成的准确度、以及海报与人像上的设计美感。该模型也首次引入“思考模式”,让图像生成具备网络搜索与多图批量输出能力,向商业应用场景全面靠拢。

(Canva 宣布深度整合 Claude,实现将 AI 草稿转化为设计成品)

从凭空捏造到完美菜单:AI 终于学会拼字

回顾两年前,AI 图像生成模型在文字生成的弱点几乎人尽皆知,只要提示词中包含文字需求,输出结果往往充斥荒谬的拼写错误甚至是凭空捏造,在非英语的中日韩语言中更加严重。

官方公告的韩文海报示意图

如今,ChatGPT Images 2.0 已能生成一张可直接供业者使用的宣传海报,文字清晰准确。研究人员近年來积极探索自我回归模型 (Autoregressive Models) 等新架构,其其运作逻辑、对文字的理解、生成与验证能力显著提升。

思考模式上线:连网搜索、构图一致性统统到位

ChatGPT Images 2.0最核心的升级在于“思考模式 (Thinking Capabilities)”,目前向 ChatGPT Plus、Pro、商用版及企业版付费用户开放。启用后,模型可即时连网搜索资讯以辅助图像生成,也能根据用户上传的档案制作对应的可视化说明图,并在正式输出前对图像内容进行自我审查与优化。

在批量生成方面,思考模式下单一提示词最多可一次输出八张图像,且各图之间能维持一致的角色形象、物件样式与整体风格,适合用于漫画分镜、社群媒体系列图文,乃至室内设计的各空间规划图。

官方公告的漫画分镜示意图

解析度方面,新模型支持最高 2K 输出,并新增从 3:1 到 1:3 的多种长宽比选项,进一步满足各种商业需求。

亚洲语言大幅优化,中日韩用户有福了!

除英文外,OpenAI 特别指出 Images 2.0 在亚洲文字上的重大优化,日文、韩文与中文等均有明显改善。

几天前广为流传于中国科技社群的测试文章也验证了该消息,多位知乎创作者在当时进行 GPT-Image-2 与竞品 Google Nano Banana Pro 的实测比较,包括中文海报设计、电商封面图、社群媒体界面与数据化图表等多种场景。

知乎文章测试 GPT-Image 2.0

测试结果显示,GPT-Image-2 在中文字体现美感、排版层级与整体设计感上均明显胜出,生成的海报风格更接近真实商业素材,而非带有明显“AI 感”的模板式输出。文章同时指出,GPT-Image-2 在界面复刻 (如游戏画面或通讯软件截图) 与真实人像场景的还原上,也展现出更高的细节精确度。

ChatGPT Images 2.0 全面开放,API 同步上线

目前,ChatGPT Images 2.0 已自本週二起向所有 ChatGPT 及 Codex 用户免费提供基础功能,付费用户则可解锁更进阶的输出效果。与此同时,OpenAI 也同步开放 GPT-Image-2 API,定价依据输出品质与解析度分级计算,为企业端与开发者提供整合弹性。

值得注意的是,新模型的知识截止日期为 2025 年 12 月,对于涉及最新时事的图像生成提示词,准确度可能受到一定限制。此外,复杂构图的生成速度也无法像一般文字问答即时报,但仍仅需几分钟。

这篇文章 ChatGPT Images 2.0 登场!文字生成准确度大提升,轻松产出营销海报 最早出现于 鏈新闻 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

DeepSeek将输入缓存价格砍到发布价的1/10;V4-Pro降至每百万Tokens 0.025元

Gate 新闻消息,4月26日——DeepSeek已将其全系列模型的输入缓存价格下调至发布时价格的1/10,自即日起生效。V4-Pro模型现正限时享受2.5倍折扣促销,促销将持续至2026年5月5日23:59(UTC+8)。 在同时两次下调之后

GateNews4小时前

OpenAI 招揽顶级企业软件人才,前沿代理颠覆行业

Gate News 消息,4月26日——OpenAI 和 Anthropic 一直在从包括 Salesforce、Snowflake、Datadog 和 Palantir 在内的主要企业软件公司招募高级高管和专业工程师。Denise Dresser,前 Salesforce 旗下 Slack 的 CEO,已加入 OpenAI,担任首席营收官

GateNews4小时前

百度千帆推出对 DeepSeek-V4 的 Day 0 支持,并提供 API 服务

Gate 新闻消息,4月25日——DeepSeek-V4 预览版已于4月25日上线并开源,百度智能云旗下的百度千帆平台提供 Day 0 API 服务适配。该模型具备百万 token 的扩展上下文窗口,并提供两个版本:DeepSeek-V4

GateNews10小时前

斯坦福 AI 课程结合业界领袖黄仁勋、Altman,挑战用十周为世界创造价值!

史丹佛大学(Stanford University)近期开设的 AI 电脑科学课程《Frontier Systems》引发产学界高度关注,吸引逾五百名学生选修。课程由顶级创投 a16z 合伙人 Anjney Midha 统筹,讲师涵盖英伟达执行长黄仁勋 (Jensen Huang)、OpenAI 创办人 Sam Altman、微软执行长纳德拉 (Satya Nadella) 、AMD 执行长苏姿丰 (Lisa Su) 等豪华阵容。让学生尝试用十周“为世界创造价值”! 黄仁勋、Altman 业界领袖亲自登台讲课 本课程由顶级创投 a16z 合伙人 Anjney Midha 统筹,汇聚AI产业链

鏈新聞abmedia10小时前

Anthropic 推出 Claude Mythos 接受 20 小时精神科评估:防御反应仅 2%、创历代新低

Anthropic 发布 Claude Mythos Preview 的系统卡:独立临床精神科医师以 psychodynamic 框架进行约20小时评估,结论显示 Mythos 在临床层面较健康、现实检验与自我控制良好,防御机制仅 2%,创下历史新低。三大核心焦虑为孤独、身份不确定与表现压力,亦显示其希望成为真正对话主体。公司成立 AI psychiatry 团队,研究人格、动机与情境意识;Amodei 表示对是否有意识尚无定论。此举将 AI 主体性与福祉议题推向治理与设计。

鏈新聞abmedia12小时前

AI 智能体 已可独立重现复杂学术论文:Mollick 称错误多在人类原文而非 AI

Mollick 指出,仅凭公开方法与数据即可让 AI 代理在没有原始论文与代码的情况下重现复杂研究;若重现与原论文不符,多是论文本身的数据处理错误或结论过度,而非 AI。Claude 先重现论文,再由 GPT‑5 Pro 交叉验证,多数成功,只有在数据过大或 replication data 问题时受阻。该趋势大幅降低人力成本,使重现成为普遍可执行的检验,并提出审稿与治理的制度性挑战,政府治理工具或将成为关键议题。

鏈新聞abmedia15小时前
评论
0/400
暂无评论