GPT Images 2 是基于 GPT Image 2 (gpt-image-2) 的 AI 图像生成器 — OpenAI 首个具备思考能力的图像模型。文字近乎完美渲染、多语言支持、最高 4K 分辨率,支持文生图与图生图。
GPT Images 2 是基于 OpenAI GPT Image 2 模型 (gpt-image-2) 的 AI 图像生成器。与过去「拿到提示词就直接画」的模型不同,GPT Image 2 会先对场景进行推理:构图、光线、文字位置、多主体关系都会在动笔之前想清楚。模型知识截止日期为 2025 年 12 月,支持中文、日文、韩文、印地文等多语言,覆盖营销、产品设计、内容创作、教育以及个人创意等多种场景。
GPT Image 2 是 OpenAI 首个具备思考能力的图像模型。它会在渲染前规划构图、校验文字、联网搜索,并自检输出结果。更好的构图感和视觉品味让生成的图像不再有「AI 感」。
gpt-image-2 最大的飞跃:招牌、标签、UI 文字、按钮和多词字符串都能精准渲染,支持 CJK(中文、日文、韩文)、阿拉伯文、印地文和孟加拉文。真正可以用于广告、海报和产品 UI 设计稿。
GPT Image 2 对物理、光线和材质的理解远超模式匹配。GPT Image 1.5 的偏暖色彩已被消除,取而代之的是中性精准的色彩还原、真实的肤色和令人信服的景深。
模型知识截止日期为 2025 年 12 月,对现实世界具有上下文感知。推理模式下还可联网检索,以真实品牌、地标、产品图和时事作为参考,让输出更贴近事实。
GPT Image 2 正在缩小 AI 图像与专业设计师 / 摄影师作品之间的差距。GPT Images 2 将这些能力整合到专注的工作流里,帮助你在品牌、产品、营销等场景中更快产出更好的视觉内容。
只需四步,把一段文字描述变成可以直接使用的成品图。
注册免费账号或使用 Google 登录,即可立即开始生成图像。
选择画幅、质量,并编写提示词,说明主体、风格、氛围、构图,以及需要出现在画面里的文字。
GPT Image 2 会根据提示词推理并渲染高质量图像,一次最多生成 8 张一致的变体。
挑选最满意的结果,以 PNG 格式下载,分辨率最高 2K。
让 gpt-image-2 相较 DALL·E 3 和 GPT Image 1 实现代际飞跃的所有关键能力 — 现可通过 GPT Images 2 体验。
快速迭代用即时模式,复杂创作切到推理模式,按需消耗算力。
小字、标题、UI 标签,以及中文、日文、韩文、阿拉伯文、印地文、孟加拉文等非拉丁字符都能清晰可读。
单反级的光影、肤色和材质,告别过去 AI 图像过于光滑的「假」感。
支持自定义尺寸,最高 4K (3840 px)。从 3:1 横幅到 1:3 竖版,每条边需为 16 的倍数。
同一提示词最多输出 8 张风格和内容一致的变体,适合系列创作。
推理模式下可检索网页信息,让输出对齐真实世界的品牌和细节。
在像素艺术、日漫风、电影剧照、插画等风格化类别上都有显著提升。
从文字描述生成,或上传参考图进行编辑、风格迁移和基于蒙版的局部重绘。
构建在 OpenAI 负责任 AI 流程之上,内置内容审核与策略约束。
快速了解新模型带来的关键指标。
最高分辨率 (3840 px)
单次一致输出图片数
文字渲染改进的语言
关于 gpt-image-2 模型以及 GPT Images 2 的常见疑问解答。