WIRED：OpenAI 升级 ChatGPT 图像生成模型，画质更强

Reece Rogers 科技装备 2026 年 4 月 21 日下午 3:00

OpenAI 升级 ChatGPT 图像生成模型

ChatGPT Images 2.0 正式登场。我们的测试表明，该模型在生成更精细的图像和渲染文字方面表现更佳，但在处理英语以外的语言时仍存在挑战。

图片来源：NurPhoto/Getty Images

评论加载器保存故事保存此故事评论加载器保存故事保存此故事

周二，OpenAI 推出了一款全新的图像生成人工智能模型，命名为 ChatGPT Images 2.0。该模型支持从单一提示词生成多张图像（例如整套学习手册），并能输出文本内容，包括中文、印地语等非英语语言。此次更新已面向全球 ChatGPT 及 Codex 用户开放，付费订阅用户还可使用功能更强大的版本。

每当一家主流 AI 公司发布新的图像模型，往往能重新激发公众兴趣并推动使用量增长，尤其是当社交媒体用户开始参与可“模因化”的趋势、将自己转化为图像时。去年，谷歌推出 Nano Banana 模型便是一个重要里程碑，当时用户纷纷在网上发布高度逼真的自塑像，引发广泛关注。今年早些时候，ChatGPT 图像功能也在社交媒体上掀起热潮，用户广泛分享由 AI 生成的讽刺漫画式肖像。

由 OpenAI 生成的人工智能图像

有何不同？

由于新模型能够调用 ChatGPT 的“推理”能力，Images 2.0 不仅可以联网检索最新信息，还能一次性生成多张图像。本质上，该模型可通过增加中间步骤，从单一提示词中产出更详尽、更完整的图像结果。此外，Images 2.0 的知识截止日期也已更新至 2025 年 12 月。

这也意味着新模型的输出更加细致入微。例如，我曾要求生成一张包含旧金山次日天气预报及推荐活动的信息图。ChatGPT 生成的图像不仅准确呈现了雨天的天气细节，还绘制了外观逼真的地标建筑，如渡轮大厦（Ferry Building）、卡斯特罗剧院（Castro Theater）、彩绘女士屋（Painted Ladies）以及泛美金字塔（Transamerica Pyramid）。

此外，Images 2.0 为用户提供了更高的自定义灵活性，特别是那些希望获得独特宽高比图像输出的用户。新模型支持从 3:1 宽屏到 1:3 竖屏的各种比例，用户甚至可以在提示词中直接指定图像尺寸。

初步印象

在使用新模型生成图像数小时后，我对其中文以外的英文文本渲染能力总体感到印象深刻。就在不久前，任何主流模型生成的含文字图像往往会出现大量乱码字符或拼写错误的单词。两年前，ChatGPT 曾难以准确标注图像中的文字；如今，Images 2.0 所呈现的更清晰、更复杂的输出，正是持续进步的有力证明。谷歌在其近期版本的 Nano Banana 中也同样致力于提升含文字图像的输出质量。

由 Reece Rogers 生成的人工智能图像

用新模型测试不同语言的输出结果……