Solo printing:GPT-4o繪圖再升級
2025/3/27 下午1:51
文/寶玉xp(發表於2025/3/26)
ChatGPT現在能用GPT-4o直接生成超逼真圖片了!
AI畫圖再進化:文字不再亂碼,細節更真實,商用價值大增!
你能想像,動動嘴就能讓ChatGPT生成複雜的科學實驗圖、清晰的菜單,甚至是生動的漫畫嗎?這件事如今變得更容易了。
OpenAI正式宣佈將全新升級的圖像生成功能整合進ChatGPT。這次升級的核心是GPT-4o模型,用戶無需額外工具即可在ChatGPT內直接生成高質量的圖片。
這次升級帶來了哪些值得關注的新特性?以下為你一一解讀:
「畫圖神器」GPT-4o 的新功能
更準確的細節,「組合」再複雜也能畫對GPT-4o擁有更強大的圖像生成能力,尤其在複雜元素組合(binding)上表現出色。過去,一旦你要求AI同時繪制多個顏色、形狀的物體,往往會出錯,比如「藍色星星和紅色三角形」可能被錯誤地繪成「紅色星星」。但GPT-4o能夠準確處理15~20個物體及屬性,讓畫面呈現更高精度的細節,滿足複雜的場景需求。
文字生成能力躍升,告別亂碼困擾
過去,AI生成的圖片上文字往往存在錯字、亂碼等問題,影響實用性。GPT-4o則專門解決了這個痛點,可以穩定地生成清晰準確的文本。無論是餐廳菜單、科學示意圖,還是品牌宣傳海報,現在用ChatGPT一鍵搞定,效果堪比專業設計師。
知識整合更強,隨手生成高品質科普內容
GPT-4o的另一個重要特性是「知識融入」。它並非簡單地生成圖片,而是具備深厚的世界知識。只需一句簡單提示,比如「牛頓的三稜鏡實驗」。你無需解釋更多細節,它就能準確還原實驗場景。
全新圖像生成方式
GPT-4o的技術原理與傳統的擴散模型(Diffusion)不同。它採用了類似人類寫作的「自回歸」(autoregressive)模式:從圖片左上角開始逐步繪制到右下角,每一步都基於之前繪制的內容展開。這種模式顯著提升了細節的精准度和文字渲染的效果。
OpenAI研究負責人Gabriel Goh透露,這個過程整整迭代了近一年,上百名人類訓練員參與了細節糾錯,以提升AI的畫圖水準。簡單來說,就是AI「師從人類」,不斷改進,才有了今天驚艷的表現。
所有ChatGPT用戶都可使用,但免費版有限制
這次升級同時面向ChatGPT免費版、Plus、Pro及Team所有用戶開放。但免費版的每日圖片生成數量仍然有限制(此前DALL-E為每天3張,GPT-4o具體數字暫未公佈,但預計相似)。
目前,GPT-4o生成圖片的速度略慢於之前的DALL-E 3。但OpenAI表示,這點延遲完全值得,因為「圖片質量和知識整合的提升遠超等待幾秒帶來的不便。」
安全與版權問題,OpenAI如何回應?
針對AI生成圖片引發的安全、版權爭議,OpenAI表示已經部署了更嚴格的安全措施,包括:
• 禁止生成色情內容、兒童不當圖像。 • 禁止去除水印、禁止模仿在世藝術家作品。 • 所有生成圖片都含C2PA元數據,標記為AI生成,便於追蹤來源。
OpenAI運營總裁Brad Lightcap強調,GPT-4o的數據訓練中已獲得Shutterstock等公司的授權,也提供藝術家內容的主動「退出」機制,保障版權與合規。
實際應用場景更多元,商業價值凸顯
全新的GPT-4o不僅僅局限於娛樂、科普,它更是企業商用的新利器。例如:
• 設計團隊可快速生成品牌LOGO和透明背景貼圖 • 餐廳老闆一分鐘做好菜單、宣傳海報 • 辦公場景可直接生成演示文檔和高品質圖表。
GPT-4o的發佈,讓AI圖像從「能看」升級為「好用」,進一步推動了AI商業應用的普及。
我自己測試了一下,文字生成部分真的是相當不錯,可以比較穩定的生成想要的文字,這能解鎖很多有價值的場景,也減少了對畫圖工具的依賴。
0 則留言