4 月 22 日,OpenAI 推出 ChatGPT Images 2.0 图像模型,显著提升复杂视觉任务处理能力,在指令理解、对象摆放与关系表达、以及高密度文本渲染方面实现升级。该模型支持多语言文本生成,能够在图像中准确呈现非英文内容,并提升整体语义连贯性。
在生成能力方面,ChatGPT Images 2.0 可实现更精细的细节控制,包括小字体、图标、UI 元素及复杂构图,最高支持 2K 分辨率输出。同时在风格表现与写实能力上进一步增强,可稳定生成照片级画面、影视风格、像素风及漫画等多种视觉类型,适用于游戏开发、分镜设计与营销素材制作等场景。具备端到端任务处理能力,可完成从文案生成到设计构图的完整流程。
ChatGPT Images 2.0 已向所有 ChatGPT 与 Codex 用户开放,其中具备「思考能力」的图像功能面向 Plus、Pro 与 Business 用户开放(Enterprise 即将支持)。底层模型 gpt-image-2 亦已开放 API 接入。
币须知道