Solo printing:GPT-4o繪圖再升級

2025/3/27 下午1:51

Solo printing:GPT-4o繪圖再升級

文/寶玉xp(發表於2025/3/26)

ChatGPT現在能用GPT-4o直接生成超逼真圖片了!

AI畫圖再進化:文字不再亂碼,細節更真實,商用價值大增!

你能想像,動動嘴就能讓ChatGPT生成複雜的科學實驗圖、清晰的菜單,甚至是生動的漫畫嗎?這件事如今變得更容易了。

OpenAI正式宣佈將全新升級的圖像生成功能整合進ChatGPT。這次升級的核心是GPT-4o模型,用戶無需額外工具即可在ChatGPT內直接生成高質量的圖片。

這次升級帶來了哪些值得關注的新特性?以下為你一一解讀:

「畫圖神器」GPT-4o 的新功能

更準確的細節,「組合」再複雜也能畫對GPT-4o擁有更強大的圖像生成能力,尤其在複雜元素組合(binding)上表現出色。過去,一旦你要求AI同時繪制多個顏色、形狀的物體,往往會出錯,比如「藍色星星和紅色三角形」可能被錯誤地繪成「紅色星星」。但GPT-4o能夠準確處理15~20個物體及屬性,讓畫面呈現更高精度的細節,滿足複雜的場景需求。

文字生成能力躍升,告別亂碼困擾

過去,AI生成的圖片上文字往往存在錯字、亂碼等問題,影響實用性。GPT-4o則專門解決了這個痛點,可以穩定地生成清晰準確的文本。無論是餐廳菜單、科學示意圖,還是品牌宣傳海報,現在用ChatGPT一鍵搞定,效果堪比專業設計師。

知識整合更強,隨手生成高品質科普內容

GPT-4o的另一個重要特性是「知識融入」。它並非簡單地生成圖片,而是具備深厚的世界知識。只需一句簡單提示,比如「牛頓的三稜鏡實驗」。你無需解釋更多細節,它就能準確還原實驗場景。

全新圖像生成方式

GPT-4o的技術原理與傳統的擴散模型(Diffusion)不同。它採用了類似人類寫作的「自回歸」(autoregressive)模式:從圖片左上角開始逐步繪制到右下角,每一步都基於之前繪制的內容展開。這種模式顯著提升了細節的精准度和文字渲染的效果。

OpenAI研究負責人Gabriel Goh透露,這個過程整整迭代了近一年,上百名人類訓練員參與了細節糾錯,以提升AI的畫圖水準。簡單來說,就是AI「師從人類」,不斷改進,才有了今天驚艷的表現。

所有ChatGPT用戶都可使用,但免費版有限制

這次升級同時面向ChatGPT免費版、Plus、Pro及Team所有用戶開放。但免費版的每日圖片生成數量仍然有限制(此前DALL-E為每天3張,GPT-4o具體數字暫未公佈,但預計相似)。

目前,GPT-4o生成圖片的速度略慢於之前的DALL-E 3。但OpenAI表示,這點延遲完全值得,因為「圖片質量和知識整合的提升遠超等待幾秒帶來的不便。」

安全與版權問題,OpenAI如何回應?

針對AI生成圖片引發的安全、版權爭議,OpenAI表示已經部署了更嚴格的安全措施,包括:

• 禁止生成色情內容、兒童不當圖像。 • 禁止去除水印、禁止模仿在世藝術家作品。 • 所有生成圖片都含C2PA元數據,標記為AI生成,便於追蹤來源。

OpenAI運營總裁Brad Lightcap強調,GPT-4o的數據訓練中已獲得Shutterstock等公司的授權,也提供藝術家內容的主動「退出」機制,保障版權與合規。

實際應用場景更多元,商業價值凸顯

全新的GPT-4o不僅僅局限於娛樂、科普,它更是企業商用的新利器。例如:

• 設計團隊可快速生成品牌LOGO和透明背景貼圖 • 餐廳老闆一分鐘做好菜單、宣傳海報 • 辦公場景可直接生成演示文檔和高品質圖表。

GPT-4o的發佈,讓AI圖像從「能看」升級為「好用」,進一步推動了AI商業應用的普及。

我自己測試了一下,文字生成部分真的是相當不錯,可以比較穩定的生成想要的文字,這能解鎖很多有價值的場景,也減少了對畫圖工具的依賴。

相關影片1

相關影片2


0 則留言