來 源 | 綜合機器之心等
GPT-4o 本次更新聚焦四大核心:
多指令解析優化:顯著提升對包含多重需求的複雜指令理解能力。
技術問題處理增強:強化複雜技術及編程問題的解析與解決方案生成。
邏輯推理與創造力提升:增強創新性思維與跨領域知識融合能力。
交互界面精簡:減少表情符號使用頻率,優化專業場景對話體驗。
在AI 基準測試網站的最新評測(2025-03-26)中,升級後的 GPT-4o 取得 歷史性突破,躍升至全球第二,甚至超越了 OpenAI 今年 2月發佈的 GPT-4.5。與 2025-01-29 的測試相比,新版 GPT-4o 評分提高 30 分,並在多個關鍵領域排名第一:數學能力:從第 14 名躍升至 全球第 1。複雜難題解決:從第7名上升至全球第 1。編碼能力:從第5名提升至全球第1 。
其中,網友最感興趣的是GPT-4o降低了人工智能圖像生成技術的門檻,這功能確實很強大,文字融合零誤差、多輪對話精修圖、超強指令解析,這也給開發者和企業提供了新的工具和機會。
OpenAI 首席執行官薩姆·奧特曼(Sam Altman) 表示,此次更新帶來的提升十分顯著,並且很快將推出更多優化。目前,開發者已經可以通過 chatgpt-4o-latest API 訪問新模型,OpenAI 還計劃在未來幾周內 將這些改進擴展至 API舊模型,讓更多開發者受益。
其中GPT-4o的原生圖像出道即頂流!與DALL-E 3不同,此次OpenAI的全新圖像生成器基於其原生多模態GPT-4o模型,能夠同時理解圖像和文本,可以非常好地遵循提示詞指令,輕鬆創作出虛實結合的場景,就像在現實中一樣。
GPT-4o這次帶來的不是魔法,它解決很多AI圖片創作的長期痛點,比如:
1.原生多模態集成:GPT-4o將圖像生成能力直接嵌入模型,不再依賴外部的DALL-E。模型可以無縫結合文本和圖像上下文,生成更符合用戶意圖的內容。
2.更棒的文本渲染:GPT-4o能準確生成圖像中的文字,支持複雜排版,如菜單、標誌、信息圖表等。這使其從單純的藝術生成轉向實用性工具,例如製作宣傳海報或教育圖解。(但是,現在中文還是會有細節問題)。
3.上下文感知與多輪優化:GPT-4o可以進行多輪對話來改圖,且很好的遵循上下文。
4.多樣化風格與高質量輸出:從逼真的攝影效果到創意插畫,GPT-4o展現了廣泛的風格適應性,生成的圖像細節豐富、光影真實,視覺效果令人驚嘆。
新模型幾乎可以可視化全部東西,甚至包括待辦事項列表(To-Do List)。
給GPT-4o輸入情緒板或視覺樣圖,就可以創建遵循相同風格的圖像。
有審美的文字排版:從海報到梗圖,不僅準確,字在哪裡都聽你指揮,還可以一次性顯示完整漫畫。
P 圖全家桶:摳圖、換臉、擴圖樣樣行,還能結合不同圖片中的元素生出一張新圖來。
從一鍵風格遷移、秒出高保真線框,到精準呈現複雜信息圖和完整漫畫,GPT-4o在提示遵循、結果質量、排版、編輯能力、角色一致性等方面,都非常Nice。
隨着大量用戶在互聯網上發佈 ChatGPT 生成的圖像,OpenAI 升級後的圖像工具火爆程度遠遠超出了預期。
過去一天,全網已被各種GPT-4o生成的吉卜力風格AI圖片淹沒。這也導致GPT-4o 生成圖像的速度越來越慢,很多用戶已經在抱怨了,周四時生成一張圖片的速度就長達半個小時。
今天凌晨,OpenAI CEO 山姆・奧特曼在社交平台 X 上宣布 ChatGPT 圖像生成功能開始暫時受限。這一次,他沒有具體說明次數限制是多少,但表示希望這項保障措施不需要實施很長時間,因為 OpenAI 正在嘗試優化效率。
要知道,現在 GPT-4o 生圖還是僅限於付費版用戶的功能(Plus、Pro 和 Team 用戶)。雖然奧特曼仍然許諾免費的 ChatGPT 賬戶未來每天可以獲得三次生成機會,但是照目前的情況來看距離兌現反而還越來越遠了。
人們從 GPT-4o 生成的圖像中發現:GPT-4o 的繪圖能力源自 LLM 本身,並不是像以前那樣簡單地調用專門的生圖模型(Dall-E)。
經過了最新的思維鏈流程,AI 充分結合了自身的知識,能夠實現更好的反饋。
用 GPT-4o 生成的圖片。圖據網絡
原生多模態的大模型是如此的強大,對此很多業內人士已經開始認為,當下一些明星 AI 創業公司開發的圖像生成工具、RAG 工具、AI IDE、工作流、智能體等會在基礎大模型能力提升之後變得不值一提。
OpenAI 曾報告說,GPT-4o 生圖能力的大幅提升源自於一系列技術改進,在執行生成任務的過程中,AI 會對人類提出的 Prompt 進行細化,編寫出一個更加詳細的英文版提示詞。它還會充分調用模型內已有的知識庫和對話上下文,並對人們上傳的參考圖片預先進行轉化處理。
由此生成的圖片可以輕鬆獲得人們構想的效果,具備完美的風格一致性,一舉讓此前還屬於玩具的圖像生成工具成為了兼具準確性與實用性的強大工具。
AI生圖超進化,對於創意工作者、動畫設計師來說,卻是另一個巨大的衝擊。自從奧特曼換了頭像帶起節奏,很多人在用 GPT-4o 生成吉卜力工作室畫風的圖像,有人做出了表情包開始賣,也有人推出濾鏡 App。
不過據說有網友說,自己剛剛收到吉卜力工作室律師函。這位小哥推出了一款能將所有照片轉換為吉卜力風格圖像的應用,於是工作室以「未經授權使用吉卜力工作室知識產權」為由,要求小哥下架相關應用。
要知道,宮崎駿和團隊為一部電影動畫,付出驚人努力是難以想像的。
每部作品通常包含6萬至7萬幀畫面,而這些畫面全部由動畫師一筆一畫手繪完成,再用水彩精心上色。
沒有電腦特效,沒有流水線式的批量生產,每一幀都是獨一無二的藝術品。一段4秒的鏡頭,便耗費了一位動畫師15個月的時間。
AI生成的圖片版權問題或許正在醞釀一場更大的風暴!