ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展

2025年03月26日04:50:17 科技 9393

財聯社3月26日(編輯 史正丞)chatgpt 上線多年後愈發雞肋的圖像生成功能,終於迎來了歷史性的升級。

ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞

openai首席執行官奧爾特曼在周二的直播活動中表示,正式推出基於gpt-4o模型的原生圖像生成功能——模型直接從文本提示生成圖像,不再調用獨立的dall-e文生圖模型。

ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞

利用gpt-4o的多模態能力,chatgpt在圖像生成時能更加精確地遵循指示、更精確地渲染圖像上的文字,同時支持多輪迭代優化圖像時保持角色形象一致。

chatgpt於2022年底上線,最初只能進行文字聊天。大約一年後,openai發佈第三代圖像生成模型dall-e 3,並集成到chatgpt,但兩者一直是互相獨立的系統。在最初的新鮮感過去後,ai圖像生成器「理解提示詞能力差」,特別是「無法準確生成圖片中的文字」嚴重阻礙這項功能在教育、職場等領域的應用。

隨着今年阿里巴巴、谷歌先後推出能準確生成文字的文生圖模型,openai終於補上這個短板。

在周二的演示中,openai展示了新一代chatgpt 的圖像功能升級到了何種程度。

首先,chatgpt已經能夠大致準確地按照提示詞,生成圖像中的文本。在演示中,ai成功按照要求生成一整頁的講話文本,同時沒有出現錯別字。奧爾特曼感慨稱,能在圖像生成功能中完美呈現文字本不應該是那麼令人讚歎的事情,但我們卻等了這麼久。

ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞

從官方給出的更多示例來看,不管是生成黑板板書,還是印刷體、展示科學常識的繪圖,chatgpt在生成圖像文字領域終於從完全不能用,達到接近商用的程度。

ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞 ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞 ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞

同時,chatgpt的圖像編輯功能,也變得更加有用。

在演示中,兩名研究人員與奧爾特曼合影,然後要求chatgpt將合照轉化為動畫畫風。

ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞

結合gpt-4o的知識庫和終於能把字寫清楚的能力,chatgpt也能通過簡單的提示詞,生成有關相對論的漫畫彩圖。

ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞

說到漫畫,現在chatgpt也能根據漫畫草稿,一鍵生成上完色的成品。同時也支持上傳圖片更換漫畫里的主要角色。

ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞 ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞 ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞

從商業應用方面來講,現在模型也能根據用戶上傳的照片和卡片模板,自定義組合生成新的卡片,並按照要求展示圖片和文字。

ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞 ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞

gpt‑4o也可以根據聊天上下文的基礎來生成圖片和文字,所以生成的一系列圖像將具有一致性,這對於設計遊戲角色而言相當重要。

ChatGPT文生圖功能迎重大升級:準確生成文字 商用邊界大幅拓展 - 天天要聞

openai承認,新的圖像生成器也存在一些局限性,例如也會受到模型幻覺影響,同時在密集文字和非拉丁語文字的圖像生成方面,也更容易出現問題。

從周二開始,基於gpt‑4o的圖像生成功能向所有免費和付費用戶推出,未來幾周內開發者將能通過api調用這項功能。

(財聯社 史正丞)

科技分類資訊推薦

二十年前的586電腦,奔III處理器+Win98系統,閑魚賣2680元 - 天天要聞

二十年前的586電腦,奔III處理器+Win98系統,閑魚賣2680元

之前我寫了個九十年代的海爾電腦機箱,閱讀量挺高的,你們愛看這玩意?那就繼續回憶殺,再寫另一個「收藏級」的586老電腦,自帶純平顯示器。它就是二十五年前的聯想天禧6622電腦,居然是大全套收藏級成色,主機箱、顯示器、鍵盤、光驅、軟驅一應俱全,
消息稱三星顯示最早下月啟動三星電子首款三摺疊手機顯示面板量產 - 天天要聞

消息稱三星顯示最早下月啟動三星電子首款三摺疊手機顯示面板量產

IT之家 5 月 9 日消息,韓媒 daily.hankooki 當地時間今日報道稱,三星顯示預計最早 6 月、最晚 7 月開始量產三星電子首款三摺疊手機(IT之家註:即所謂的 Galaxy G Fold)的顯示面板。▲ 三星顯示 Flex G 三摺疊概念設備報道指出,由於三摺疊手機在整體智能手機市場尚屬新形態,因此三星顯示的面板產量初期預計落在 20~30
Retroid Pocket Mini V2 安卓遊戲掌機發佈,1399 元 - 天天要聞

Retroid Pocket Mini V2 安卓遊戲掌機發佈,1399 元

IT之家 5 月 9 日消息,Retroid 今日推出安卓遊戲掌機 Pocket Mini V2,迭代機型主要解決初代的顯示問題,更換到該公司 Pocket Classic 掌機的同款 3.92 英寸 AMOLED 屏幕,其餘配置參數一致,目前僅提供黑色,官網首發售價 1399 元。Retroid Pocket Mini V2 搭載高通驍龍 865 處理器,
谷歌消息開始推出「為所有人刪除」功能 - 天天要聞

谷歌消息開始推出「為所有人刪除」功能

#雙11國貨換新裝#快速導讀Android 版 Google Messages 正在推出一項新功能,允許用戶在群組 RCS 對話中刪除所有人的聊天信息,提供「為所有人刪除」和「為我刪除」兩個選項。
盤點那些霸屏「五一」叫好又叫座的「主題展」 - 天天要聞

盤點那些霸屏「五一」叫好又叫座的「主題展」

盤點 REVIEW&ANALYSISIP主題展現階段的IP主題展正從流量收割向長效情感聯結的升級。中購聯新媒體中心作者丨李洪健在剛剛過去的五一假期,消費市場的蓬勃氣象讓人欣喜,據交通運輸部數據,5月1日至5日,預計全社會跨區域人員流動量累計
一個時代的結束:某運營商官宣終止3G服務 - 天天要聞

一個時代的結束:某運營商官宣終止3G服務

香港近年將流動通信服務升級至5G後,有電信運營商宣布終止3G服務,港媒報道稱,這是「一個時代的結束」。據報道,香港四大電信商之一中國移動旗下中國移動香港公司近日宣布,計劃於2025年6月30日零時正式停止3G服務的運營。此舉旨在優化資源配置