
新智元報道
新智元報道
【新智元導讀】gpt-4時代,落幕了!它將被gpt-4o完全取代。而下周,我們也極有可能迎來gpt-4.1、o3 滿血版以及o4-mini這些新模型。大模型進化史,再次迎來關鍵節點。

從4月30日起,gpt-4將被當前的默認模型gpt-4o完全取代。
不過,懷念gpt-4的用戶們也不必悲傷,它仍然可以通過openai api繼續使用。
不過,在gpt-4退役之前,人們的注意力很可能就會轉向chatgpt的新模型。
如今各種爆料已經傳得漫天飛,據說,gpt-4.1(包括gpt-4.1-mini、gpt-4.1-nano和gpt-4.1),去年12月宣布的o3 「推理」模型,以及o4-mini全新推理模型都要來了。
遙想2023年3月14日,gpt-4正式發布,席捲全球,在全球掀起滔天巨浪,然後在兩年內,引爆了全球ai大模型的寒武紀大爆發。
它的出現,開啟了一個全新的時代,見證了一場技術井噴的大爆發,鋪墊了後續無數openai大模型的繁榮。
如今,這座燈塔終於要退出了。


perplexity ceo aravind srinivas最近表示,ai的進步已經跨越了臨界點——三個月的時間,彷彿就已經跳過了一章歷史。

「我們應該期待,在今年剩餘的時間裡,變化會來得更快。」
的確,就在過去短短三個月里,我們迎來了deepseek r1、原生圖像生成、o3-mini等重磅炸彈,如今2025年也不過剛過去了四個月。
在ai圈的眾多消息中,連gpt-4的退出都顯得不那麼驚爆了。
昨天的更新日誌中,openai表示,現在gpt-4o已經成為了gpt-4合格的繼任者。
近期的升級,提升了它的指令跟隨、問題解決和對話流暢性。評估中,gpt-4o在寫作、編碼、stem等方面始終優於gpt-4。
確實,現在很多人都已經不記得,自己上一次用gpt-4是什麼時候了。


雖然它確實給很多人帶來了美好的回憶,甚至讓人一度以為agi已經來了。

還記得2023年3月,gpt-4推出時全網歡呼的盛況嗎?
當時,它在chatgpt和微軟的copilot網頁版聊天機器人中上線,引起全網驚呼。
這個模型具備多模態能力,能同時理解圖像和文本,正式開啟了ai「看圖說話」的時代,這在openai的模型中尚屬首次,可謂石破天驚。

相比於gpt-3.5,gpt-4是一次更重大的認知躍遷。
它是首個在專業學術基準中達到哈佛、斯坦福畢業生水平的大模型。
它在數學、醫學、法律之類的考試中擊敗大多數人類;在sat、lsat、美國律師資格考試中交出驚人答卷,能達到top 10%。
它的多模態架構,也為後續的模型演進提供了核心藍本。
從此,大模型能力的閾值徹底提升至可用級,引爆了全球的ai應用生態,將生成式ai市場從百億規模推升至萬億的量級。
它推動了code interpreter的誕生,為開發者提供了無限助力,間接推動了開源生態。
那時,幾乎每天一個勁爆消息。那是openai的高光時刻,它的一舉一動都牽動著全世界的目光。
當時,全網都在猜測gpt-4的訓練成本。後來奧特曼透露,gpt-4的訓練成本超過了1億美元。
終於,在23年11月,速度更快、成本更低的gpt-4 turbo上線,接替了它的地位。

還記得這些輝煌時刻嗎?







就在前一天,the verge獨家爆料稱,openai正準備發布一系列全新模型——包括gpt-4.1(含gpt-4.1 mini和gpt-4.1 nano)、滿血版o3,以及神秘的o4系列(o4-mini、o4-mini-high)。
其中,作為多模態模型gpt-4o改進版的gpt-4.1,最快將在下周面世。
目前,ai工程師tibor blaho已經在chatgpt網頁代碼中發現了對這些模型的引用。

不過,gpt-4.5都來了,為什麼下一個卻是gpt-4.1?這個越來越倒退的命名規則,實在令人摸不到頭腦。

它在openai大模型譜繫上,實在有點前不著村後不著店,不知該放在什麼位置。

有人讚歎道:看到從gpt-1到o系列以及更高級別的演變,展示了不斷增加的複雜性和能力。這就像觀察人工智慧的進化史!
關於gpt-4.1,現在坊間已經有了蛛絲馬跡。
比如有人發現,在chatgpt的模型列表中,竟然已經出現了gpt-4.1這個選項。

這就意味著,此前泄露的小道消息是真的!這就讓大家非常興奮。
但也有人懷疑該網友是造假,把網址從gpt-4o改為了gpt-4.1。
為了證實清白,這名網友大方分享出了自己和gpt-4.1的對話鏈接。

因此大家確認,這名網友並沒有撒謊,或偽造截圖,因為順著這個對話鏈接檢查,會發現model-slug確實是gpt-4.1。


很快,有越來越多的人發現自己也能用gpt-4.1了。

此外,也有網友推測,奧特曼口中的「quasars alpha」,就是gpt-4.1。


而ft的報道也再次證實,滿血版o3下周很可能再次上線。
知情人士透露,由於meta、谷歌、xai這些對手逼得實在太緊,openai為了保持自己的技術優勢並從中獲利,不得不加快模型的發布速度。
為此,曾經需要數月時間進行的模型「評估」——測試模型的風險和性能,如今已被壓縮到了只有短短的幾天。
比如即將退役的gpt-4,就有著長達6個月的評估期。其中一些危險能力,正是在測試進行了兩個月後才被發現的。
但現在給到的時間和資源,已經不足以進行全面的測試來識別和規避風險了。

此前,openai曾承諾構建定製版的模型來評估潛在的濫用風險,例如是否可能助長生物病毒提高傳播能力。
但這種方法成本很高,不僅要聘請外部專家,還要創建諸如病毒學這類的專業信息數據集,並將其「喂」給模型來進行微調,消耗大量的工程師和計算資源。
很明顯,openai不想在這件事上花太多精力——他們只對能力較弱的舊模型做了微調,沒有用到更強、更先進的模型上。
比如,在1月份發布的o3-mini安全與性能報告中,只提到了gpt-4o只會在微調後才能執行某項生物學任務。至於o1和o3-mini如何,openai卻隻字未提。
另外,還有一個令人擔憂的問題是,安全測試針對的並不是最終向公眾發布的模型,而是更為早期的「檢查點」(checkpoints)。在這之後,模型還會繼續更新來提升性能和能力。
面對這些質疑,openai回應稱,其評估流程已通過引入自動化測試等方式提高了效率,從而縮短了所需時間。
「雖然目前還沒有一套公認的方案,但openai採用的方法肯定是最優的,並且已在報告中公開透明地進行了說明。」
此外,openai還表示,測試所用的檢查點與最終發布的版本「基本一致」。