Solo printing：GPT-4o繪圖再升級

2025/3/27 下午1:51

文/寶玉xp(發表於2025/3/26)

ChatGPT現在能用GPT-4o直接生成超逼真圖片了！

AI畫圖再進化：文字不再亂碼，細節更真實，商用價值大增！

你能想像，動動嘴就能讓ChatGPT生成複雜的科學實驗圖、清晰的菜單，甚至是生動的漫畫嗎？這件事如今變得更容易了。

OpenAI正式宣佈將全新升級的圖像生成功能整合進ChatGPT。這次升級的核心是GPT-4o模型，用戶無需額外工具即可在ChatGPT內直接生成高質量的圖片。

這次升級帶來了哪些值得關注的新特性？以下為你一一解讀：

「畫圖神器」GPT-4o 的新功能

更準確的細節，「組合」再複雜也能畫對GPT-4o擁有更強大的圖像生成能力，尤其在複雜元素組合(binding)上表現出色。過去，一旦你要求AI同時繪制多個顏色、形狀的物體，往往會出錯，比如「藍色星星和紅色三角形」可能被錯誤地繪成「紅色星星」。但GPT-4o能夠準確處理15~20個物體及屬性，讓畫面呈現更高精度的細節，滿足複雜的場景需求。

文字生成能力躍升，告別亂碼困擾

過去，AI生成的圖片上文字往往存在錯字、亂碼等問題，影響實用性。GPT-4o則專門解決了這個痛點，可以穩定地生成清晰準確的文本。無論是餐廳菜單、科學示意圖，還是品牌宣傳海報，現在用ChatGPT一鍵搞定，效果堪比專業設計師。

知識整合更強，隨手生成高品質科普內容

GPT-4o的另一個重要特性是「知識融入」。它並非簡單地生成圖片，而是具備深厚的世界知識。只需一句簡單提示，比如「牛頓的三稜鏡實驗」。你無需解釋更多細節，它就能準確還原實驗場景。

全新圖像生成方式

GPT-4o的技術原理與傳統的擴散模型(Diffusion)不同。它採用了類似人類寫作的「自回歸」(autoregressive)模式：從圖片左上角開始逐步繪制到右下角，每一步都基於之前繪制的內容展開。這種模式顯著提升了細節的精准度和文字渲染的效果。

OpenAI研究負責人Gabriel Goh透露，這個過程整整迭代了近一年，上百名人類訓練員參與了細節糾錯，以提升AI的畫圖水準。簡單來說，就是AI「師從人類」，不斷改進，才有了今天驚艷的表現。

所有ChatGPT用戶都可使用，但免費版有限制

這次升級同時面向ChatGPT免費版、Plus、Pro及Team所有用戶開放。但免費版的每日圖片生成數量仍然有限制(此前DALL-E為每天3張，GPT-4o具體數字暫未公佈，但預計相似)。

目前，GPT-4o生成圖片的速度略慢於之前的DALL-E 3。但OpenAI表示，這點延遲完全值得，因為「圖片質量和知識整合的提升遠超等待幾秒帶來的不便。」

安全與版權問題，OpenAI如何回應？

針對AI生成圖片引發的安全、版權爭議，OpenAI表示已經部署了更嚴格的安全措施，包括：

• 禁止生成色情內容、兒童不當圖像。 • 禁止去除水印、禁止模仿在世藝術家作品。 • 所有生成圖片都含C2PA元數據，標記為AI生成，便於追蹤來源。

OpenAI運營總裁Brad Lightcap強調，GPT-4o的數據訓練中已獲得Shutterstock等公司的授權，也提供藝術家內容的主動「退出」機制，保障版權與合規。

實際應用場景更多元，商業價值凸顯

全新的GPT-4o不僅僅局限於娛樂、科普，它更是企業商用的新利器。例如：

• 設計團隊可快速生成品牌LOGO和透明背景貼圖 • 餐廳老闆一分鐘做好菜單、宣傳海報 • 辦公場景可直接生成演示文檔和高品質圖表。

GPT-4o的發佈，讓AI圖像從「能看」升級為「好用」，進一步推動了AI商業應用的普及。

我自己測試了一下，文字生成部分真的是相當不錯，可以比較穩定的生成想要的文字，這能解鎖很多有價值的場景，也減少了對畫圖工具的依賴。

相關影片1

相關影片2

0 則留言