OpenAI刚刚发布了新版ChatGPT Images ,用ChatGPT(网页版+移动版)内置的统一图像体验取代了旧版图像工具。该版本今天起面向所有ChatGPT用户以及API用户推出,版本号为GPT-Image-1.5。
最大的升级在于编辑精度。我们可以生成图像,然后在聊天中通过局部编辑(例如图像修复或背景更改)对其进行精细调整,同时保持光线、构图和人物面部的一致性。
文本渲染效果也大幅提升,尤其是在菜单、海报和信息图表等布局密集的文本中,指令遵循度更高。对于复杂样式、多种字体和多语言文本,渲染效果有所改进,但仍有不足之处。
ChatGPT 现在包含一个专用的图像工作区,其中有预设滤镜、热门提示和一次性肖像上传功能,以及内置的图像理解功能,用于分析或转换同一主题中上传的照片。
AI图像工具一直擅长生成图像,却难以保留我们真正关心的内容。GPT Image 1.5 突破了这一局限,它的优点是能确保文本清晰可读、人脸识别一致,并且编辑效果可预测。现在,你可以对文档、布局和品牌视觉素材等真实资源进行迭代处理,而无需担心图像每次都会出现问题。
以下纯个人观点:
经过广泛测试, Gemini 3整体表现最佳。GPT 的图像输出质量不错,但许多图像仍然带有略微的 AI 痕迹,而且生成速度相对较慢。Nano Banana Pro 则以其超逼真、自然的图像脱颖而出,对人物、产品或公众人物的限制更少,生成速度也快得多,大约只需 10-15 秒。对于大多数用户而言,Nano Banana Pro 更注重实用性,Gemini 3 则在整体质量和功能方面更胜一筹。
至于为什么。。。注意他们把它叫做 1.5 没有叫 2.0,可想而知仍然落后于 Nano Banana Pro ,哈哈哈