昨天 OpenAI 推了 ChatGPT Images 2.0,這次不是小改版——它的定位從「生圖工具」變成了「會思考的視覺夥伴」。
過去做 UGC 素材或品牌視覺,最頭痛的是兩件事:圖片裡的文字歪七扭八、每次改一個細節就要重新生圖。這次的更新直接針對這兩個痛點開刀。
🧠 Thinking Mode — 生圖前先「想一下」,自動規劃構圖、計算物件數量再下筆,亂掉的機率大幅降低
📝 文字渲染升級 — 中文、日文、韓文、UI 元素、Logo 小字,現在可以直接生成不用 P 圖修
🖼 2K 解析度 + 極端比例 — 支援 3:1 到 1:3,橫幅、9:16 首幀、簡報封面一次搞定
🎞 單次 8 張一致輸出 — 同一角色、同一品牌風格,批次生成多個 Variant 比較
✏️ 對話式迭代編輯 — 直接說「把左邊那個人換成女生」,不用重寫整段 Prompt
我最在意的是中文文字渲染。之前做台灣品牌素材,圖片裡放中文字幾乎是噩夢——現在可以直接生成帶繁中標語的圖,對本地行銷工作流程是真正的升級。
API 代號是 gpt-image-2,上線 12 小時就以 +242 點差距拿下 Image Arena 全類別第一。
補充一個實用資訊:DALL-E 2 和 DALL-E 3 將在 5/12 正式退役,如果有在用 API 的同學記得更新。
你覺得「圖片生成加推理」這個方向,會改變你現在的 AI 工作流程嗎?留言聊聊 👇