全新 ChatGPT Images 发布

全新 ChatGPT Images 发布

Sketch Toon 2 days ago

最新的 ChatGPT Images 版本为 AI 视觉创作带来实质跃迁:全新旗舰图像模型与 ChatGPT 内的 Images 创作空间协同,带来“按意图精确改图”、更丰富的风格与概念变换,以及最高 4× 的生成速度提升。开发者可在 API 中以 GPT Image 1.5 使用同等能力,并获得更稳定的品牌元素保真与更低成本。

Banner

目录

为何这次更新重要:更贴合意图的图像生成

这次更新的核心承诺很直接:你说要改哪里,系统就只改那里;并在多轮编辑之间,持续保留光线、构图与人像相似度等关键要素。对实际工作而言,这意味着更实用的照片编辑、更可信的穿搭/发型试用,以及保持原图神韵的风格化或概念重绘。

精确编辑,保留关键信息

模型在加/减元素、组合/融合、位置变换等编辑上表现显著提升,最大化减少“误改”,避免让图像的“灵魂”被反复重做所稀释,从而支持高效迭代。

创意变换

除了编辑外,模型还能改造版式与文字排布,重塑场景以呈现概念,同时保留重要细节。新的 Images 体验内置预设风格与创意点子,无需撰写提示词也能快速探索视觉方向。

更强的指令遵循

相较初版,模型在复杂场景中的关系约束与版面结构遵循度更高。网格、分区、多目标构图等任务更接近你的要求。

文本渲染更稳

密集、小字号或结构化文本的呈现更加可靠,适用于海报、信息图与报纸式排版等以往需要手工修补的场景。

Image

ChatGPT 内的全新创作空间

此次发布也在 ChatGPT 侧边栏(移动端与 chatgpt.com)引入专属 Images 体验,面向高效探索与快速迭代。

侧边栏 Images 体验

内置预设滤镜与趋势提示,降低创作试错成本,既利于初学者也满足资深用户的灵感捕捉与扩展。

形象一次上传,反复复用

支持一次性上传人像/形象,并在后续创作中复用,而不必反复翻找相册。这大幅简化连载叙事与系列化设计流程。

最高 4× 的加速迭代

生成速度最高提升至 4 倍,并支持在当前渲染过程中继续生成新的图像,让创意循环更快完成、等待更少。

画质与自然度的额外提升

整体自然度更高,且在包含大量小人脸的复杂场景中表现更稳健,这些都是以往模型的薄弱环节。

Image

能力提升、API 接入与可用性

GPT Image 1.5(API)

API 中的 GPT Image 1.5 提供与 ChatGPT 同步的编辑与保真能力。相较前代,图像输入/输出成本下降约 20%,为预算内的高频迭代创造空间。

品牌保真与电商应用

在多轮编辑中更稳定地保留品牌标识与关键视觉要素,更适用于市场营销(图形、Logo 变体)与电商图集生产(从单一素材生成多变体/场景/角度)。

发布节奏与兼容性

新模型正向所有 ChatGPT 用户陆续开放,新的 Images 体验正面向大多数用户推出,企业版与商业版将随后提供访问。此前版本仍以自定义 GPT 的形式保留,便于平滑过渡。

限制与后续方向

尽管提升明显,复杂风格、多语言边界场景与科学准确性仍有提升空间。后续将持续加强精细化编辑与跨语言细节表现。

常见问题

与此前版本相比,核心改进是什么?

更强的指令遵循、更稳的构图/光线/人像相似度保留、更可靠的密集文本渲染,以及最高 4× 的生成速度提升。

如何实现“只改我说的部分”?

模型在编辑时尽量聚焦于指令指定的局部,减少意外改动,支持加/减/组合等操作的高质量可控性。

能否稳定处理多目标排版与小字?

是。多目标布局与小字号文本渲染更为稳健,适用于网格、海报与信息图等复杂结构。

开发者能获得什么?

API 中的 GPT Image 1.5 提供更强编辑/保真与更低图像 I/O 成本(较前代下降约 20%),适配品牌与电商等高频场景。

现在所有人都能用到新的 Images 体验吗?

新模型正向所有用户推广,Images 体验已覆盖大多数用户,商业版与企业版访问将稍后提供。

结语

全新 ChatGPT Images 让“按意图创作”更接近现实:精确编辑、富有表现力的变换、更快的生成循环,以及面向探索的产品体验。这将切实缩短“从想法到可用视觉”的距离,为个人与团队带来更高的创作效率。

全新 ChatGPT Images 发布