剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點

2025年06月11日08:30:27 動漫 9184
chatgpt 宕機了一整晚,全球網友已經亂成一鍋粥了。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
openai 的處理方案也有些另類,一邊抓緊時間修 bug,一邊突然上線了 o3-pro 模型。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
從今天起,o3-pro 率先向 pro 和 team 用戶開放,模型選擇器里將替代原本的 o1-pro,而 enterprise 和 edu 用戶還得等到下周。
只能說,plus 用戶的命也是命。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
o3-pro 登場,更強大,也更「慢」
作為推理模型 o3 的升級版,o3-pro 在處理複雜問題、給出更精準的回答方面表現更強,尤其在科學研究、編程、教育和寫作這些場景下,有着明顯優勢。
此外,它也支持調用 chatgpt 的全套工具,比如網頁搜索、文件分析、圖像推理、python 編程、記憶個性化等,整體執行力和整合能力都更強。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
當然,功能多了,響應速度也稍微慢了下來。
由於任務調度和工具鏈調用更複雜,o3-pro 的響應速度一般要比 o1-pro 要長一點,所以更適合在你需要認真思考,或者對答案準確性要求較高的場景中使用。
在官方專家評估中,評審人員普遍認為 o3 pro 在表達清晰度、答案完整性、指令執行能力和邏輯準確性方面都比 o3 模型更進一步,尤其適合用在科學、教育、編程、商業和寫作這些需要深度輸出的任務中。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
學術評估也驗證了這一點,o3-pro 的整體表現持續優於 o1-pro 和 o3。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
為了更科學評估模型的穩定性,openai 引入了「四次全對」的評估標準——只有模型連續四次給出正確答案,才算成功。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
可以說,這套機制大幅提升了對推理一致性的要求。
值得注意的是,o3 pro 此次並未單獨發布系統卡。openai 表示,由於 o3-pro 與 o3 使用相同的底層模型,其完整的安全性說明請參見 o3 系統卡。
但目前 o3 pro 仍存在一些功能限制,比如不支持臨時對話、圖像生成和 canvas 功能。如需生成圖像,用戶仍需使用 gpt-4o、o3 或 o4-mini 模型。
在正式上線之前,一些開發者已獲得 o3 pro 的早期訪問權限。
前 spacex 軟件工程師及蘋果 visionos 設計師的 ben hylak 在過去一周獲得了 o3-pro 的早期訪問權限,其體驗歷程也得到了 openai ceo sam altman 在社交媒體上的轉發。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
具體來說,ben 與其聯合創始人 alexis 花時間整理了 raindrop 過去所有的規劃會議記錄、目標、甚至語音備忘錄,然後請 o3-pro 嘗試生成一個戰略性規劃文檔。
最終模型生成的結果讓他們大受震撼:內容清晰、結構完整,不僅覆蓋了目標和時間線,還自動梳理出優先級,甚至明確指出了哪些內容應被砍掉。
在 ben 看來,模型再強,如果無法融入真實的工作環境,也難以成為真正有用的「成員」。
而 o3 pro 在理解複雜環境、表達工具能力、提出適當問題、合理調度資源方面有明顯提升。儘管模型偶爾在缺乏上下文時會出現「過度思考」的問題,但整體表現已明顯優於此前版本。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
o3 pro(左)vs o3(右):o3 pro 明顯更好地理解了自身的限制和能力範圍。
在與同類模型對比中,ben 則是誇獎道,雖然 claude opus 體量感十足,但實戰表現平平無奇;而 o3-pro 則更實用,屬於「完全不同維度的存在」。

在經典升級版的六邊形彈跳小球挑戰中,博主 @flavioad 認為 o3-pro 是第一個幾乎能完美處理小球與牆面真實碰撞效果的模型。

剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞

arc-agi 是一種用來評估語言模型是否具備類通用人工智能(agi)推理能力的基準測試框架。

它旨在測試 ai 系統在面對新問題時的抽象推理和問題解決能力,類似於人類在面對新情況時能夠迅速適應並找到解決方案的能力。

最新測試結果如下:

剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞

可以看到,o3-pro 在高難任務上表現略好,但提升幅度不大,且成本隨難度上升。

企業是第二曲線,o3-pro 是一塊新基石
在 o3-pro 發布,openai ceo sam altman 還在社交平台公布了一項重磅消息:o3 模型價格直降 80%。
現在,o3 模型每輸入百萬 tokens 收費 2 美元,每輸出百萬 tokens 收費 8 美元。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
openai 首席產品官 kevin weil 發文表示,由於用戶反饋強烈,plus 用戶的 o3 模型使用速率限制將提升一倍,該調整正在陸續上線中。
對比之下,o3-pro 每輸入百萬 tokens 收費 20 美元,每輸出百萬 tokens 收費 80 美元,比 o1-pro 便宜 87%。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
openai 建議在使用 o3-pro 時啟用「後台模式」:對於耗時較長的任務,將會異步啟動,從而規避請求超時問題。
官方表示,這波大降價的背後,是 openai 對推理服務架構的全面優化。模型沒變,但推理更高效,價格也就順勢調了下來。
而另一方面,或許離不開 openai 在算力資源上的新動向。
自 chatgpt 橫空出世以來,算力資源的限制一直是 openai 的「老大難」,受限於微軟綁定協議的限制,azure 雲服務曾是 chatgpt 的唯一數據中心基礎設施提供商。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
而據路透社凌晨援引三位知情人士消息稱,為了緩解算力壓力,openai 已於上個月與 alphabet( google 母公司)達成合作協議,引入 google cloud 作為額外雲服務提供商。
這樣的合作既在意料之外,也在情理之中。
一方面,chatgpt 是近年來對 google 搜索業務最大的威脅之一,而 google cloud 現在卻成了它的新靠山。
而另一方面,google cloud 2024 年銷售額達 430 億美元,占 alphabet 收入的 12%。因此,為了在雲計算市場中超越亞馬遜和微軟,google cloud 一直致力於扮演一個「中立算力供應商」的角色。
此次合作的達成將是對 google cloud 的一次重大利好。截至發稿前,openai、google 和微軟均未就此報道置評。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
與此同時,openai 還在全球範圍內加速部署 ai 基礎設施網絡。
今年早些時候,openai 還與軟銀和甲骨文推進了 5000 億美元規模的星門計劃,並與 coreweave 簽訂了價值數十億美元的算力採購協議。
高投入的前提離不開高回報,本周據外媒報道,去年,openai 的 arr 約為 55 億美元,而現在已突破 100 億美元,增長了近 80%。
需要說明的是,100 億美元僅包括其面向消費者的產品、chatgpt 付費商品以及 api 收入,暫不包括微軟的授權收入和其他大額交易。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
在商業領域,arr 是指企業從訂閱服務或長期合同中獲得的年度經常性收入。它反映了一種可預測的、持續的收入流,通常用于衡量訂閱模式業務的健康狀況和增長潛力。
簡單來說,一家提供軟件即服務(saas)的公司,與客戶簽訂了每年支付 1000 元的訂閱合同。如果有 100 個這樣的客戶,那麼該公司的 arr 就是 1000 元×100=100000 元。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
上周,openai coo brad lightcap 還透露 openai 目前擁有 300 萬付費商業用戶,高於 2 月份報告的 200 萬,可以說,openai 目前形勢一片大好。
一邊通過 o3 把基礎模型的成本打下來,一邊用 o3-pro 把複雜問題的解決能力拔上去,瞄準高價值場景,openai 也正試圖在這兩端之間,打通一條通往下一個增長曲線的路徑:企業服務。
世界上最強的模型輪流發布,openai 也是這波 ai 浪潮中的一個。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
而更強的模型,更穩的算力,更豐富的工具調用,chatgpt 的定位也早已不只是聊天機器人,而是生產力搭子,旨在吃下職場這個最具生產力的應用場景。
o3-pro 則是這條路上的一塊新基石。
至於它能不能撐起 openai 的這份野心,還有待時間驗證。但至少現在,它已經讓人們重新想象了一次。
型會開源,但不會在 6 月
就在剛剛,sam altman 還在社交媒體上表示,openai 預計將在今年夏季晚些時候,發布公開權重的開源模型,而非 6 月份。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
此外,altman 剛剛還發布了個人新博客《the gentle singularity(溫和的奇點)》,探討 ai 發展對人類社會的影響。
用他的話來說,這可能是他最後一次在完全沒有 ai 幫助下寫出的文章,「相對論的角度看,奇點是一點一點發生的,融合則是緩慢進行的。」
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
附上博客原文地址:
https://blog.samaltman.com/the-gentle-singularity
溫和的奇點
我們已經越過了事件視界,騰飛已經開始。人類正接近構建數字超級智能,而至少到目前為止,這一切並沒有看起來那麼奇怪。
機器人還沒在街頭隨處可見,大多數人也還沒整天和 ai 交流。人類仍然會死於疾病,去太空依然困難重重,我們對宇宙的理解仍然非常有限。
儘管如此,我們最近已經構建出在許多方面比人類更聰明的系統,並且這些系統能顯著放大人類的產出。最不可能的部分已經完成——那些促成 gpt-4 和 o3 等系統誕生的科學突破來之不易,但它們將帶我們走得更遠。
ai 將在多個方面為世界帶來貢獻,但 ai 加速科學進步與提升生產力所帶來的生活質量提升將是巨大的;未來有望遠比現在更加美好。科學進步是整體進步的最大驅動力;一想到我們有可能獲得多少更多的成果,就令人振奮。
從某種意義上說,chatgpt 已經比歷史上任何一個人都更強大。每天有數億人依賴它,且任務越來越重要;一項小的新增能力可能帶來極大的正面影響,而一個微小的不匹配在被數億人使用時,也可能造成很大的負面影響。
2025 年,我們迎來了能夠真正進行認知工作的智能代理;編寫計算機代碼的方式將徹底改變。2026 年,我們很可能會看到能產生原創見解的系統。2027 年,或許會出現能在現實世界中執行任務的機器人。
將有更多人能夠創作軟件和藝術。但世界對這兩者的需求也將大幅上升。專家們如果擁抱這些新工具,可能仍然比新手強得多。總體來看,2030 年一個人完成的事情將遠超 2020 年,這種變化將令人矚目,也會有許多人學會如何從中受益。
在最重要的方面,2030 年代也許不會有太劇烈的變化。人們依然會愛家人,釋放創造力,玩遊戲,在湖裡游泳。
但在仍然非常重要的其他方面,2030年代很可能與以往任何時代都大不相同。我們不知道人類智能的上限有多高,但我們即將找出答案。
到了 2030 年代,智慧和能源——即想法及實現想法的能力——將變得極其豐富。這兩者長期以來一直是人類進步的基本限制;如果智慧和能源變得充足(加上良好的治理),理論上我們可以實現一切。
現在我們已經與驚人的數字智能共處,並且在最初的震驚之後,大多數人已漸漸習慣。我們很快會從驚嘆 ai 能寫出優美段落,變成期待它寫出完整小說;從驚訝它能診斷疾病,變成期望它能研發治癒方法;從驚訝它能寫出小程序,變成希望它能創建整家公司。這就是「奇點」的方式:奇蹟變成日常,然後變成起點。
已經有科學家告訴我們,他們的工作效率是過去的兩到三倍。高級ai之所以意義重大,其中一個最關鍵的原因是我們可以用它來加速 ai 研究本身。我們也許能發現新的計算材料、更好的算法,甚至更多未知的可能。如果我們能用一年、甚至一個月完成十年的研究,進步的速度顯然會大不一樣。
從現在開始,我們已有的工具將幫助我們發現更多科學洞見,並輔助我們創造更先進的 ai 系統。當然,這還不是ai完全自主地更新自身代碼,但這確實是「遞歸自我改進」的初始形態。
還有其他一些自我強化的循環正在發生。ai 帶來的經濟價值推動了基礎設施建設的飛輪,越來越多的資源正用於運行這些強大的 ai 系統。而能夠製造其他機器人的機器人(在某種意義上,還有能建造其他數據中心的數據中心)離我們也不遠了。
如果我們必須用傳統方式製造出最初的一百萬個人形機器人,但它們隨後能接手整個供應鏈——開採和提煉礦物、駕駛卡車、運行工廠等——並製造更多機器人、芯片廠和數據中心,那進步的速度就會截然不同。
隨着數據中心的生產逐漸自動化,智能的成本最終應該會接近電力成本。(很多人關心 chatgpt 每次查詢用多少能量;平均每次查詢大約耗電 0.34 瓦時,大概相當於烤箱運行一秒多一點,或高效燈泡使用幾分鐘。此外,每次查詢大約用水 0.000085 加侖,約等於十五分之一茶匙。)
科技進步的速度將持續加快,而人類也有很強的適應能力。雖然會有艱難的挑戰,比如整類工作消失,但另一方面,世界的財富增長如此之快,以至於我們將有機會認真考慮以前無法實現的新政策。我們可能不會一次性建立一套新的社會契約,但回顧幾十年後,會發現逐步變化的累積帶來了巨大轉變。
如果歷史可以作為參考,我們總能找到新事物去做、新慾望去追求,並迅速適應新工具(工業革命後的職業變遷就是個很好的例子)。人們的期望會提升,但能力也會隨之快速提升,我們會擁有更好的生活。我們會為彼此創造越來越美妙的事物。相比 ai,人類有一個長期且重要的優勢:我們天生在意他人,以及他人怎麼想、怎麼做,而對機器卻沒什麼感情。
如果一千年前的自給農民看到我們現在的生活,會覺得我們從事的是「假工作」,彷彿只是在自娛自樂,因為我們食物充足、奢華難以想象。我希望我們未來一千年後也能用同樣的眼光看待那些工作——覺得它們「非常假」,但毫無疑問,那些人會認為自己的工作極其重要且充實。
未來將湧現出大量的新奇蹟。到 2035 年,我們會取得什麼突破現在都難以想象;可能今年我們還在解決高能物理問題,明年就開始太空殖民;或今年在材料科學上取得重大突破,明年就實現真正高帶寬的腦機接口。很多人會選擇繼續以當下的方式生活,但也肯定會有人選擇「接入系統」。
展望未來,這些事現在聽起來難以想象。但真正經歷它時,可能會讓人驚嘆,卻仍在可控範圍內。從相對論的角度看,奇點是一點點發生的,融合是逐步進行的。我們正攀登那條技術指數增長的長弧線;向前看總覺得是陡峭的垂直,向後看則像是平緩的線,但其實它是一條平滑的曲線。(回想 2020 年,如果那時我們說 2025 年會接近 agi,聽起來會很瘋狂,但對比過去五年所發生的一切,也許現在的預測不那麼瘋狂了。)
當然,我們還面臨許多嚴峻挑戰。我們需要在技術上和社會層面解決安全問題,但在那之後,最重要的是確保超級智能能被廣泛獲取,因為這關係到經濟結構。未來的最好路徑可能包括以下幾個步驟:
首先解決「對齊問題」,也就是我們能有把握地確保 ai 系統長期學會並實現我們集體真正的意願(比如社交媒體就是對齊失敗的例子:推薦算法非常擅長讓你不停刷,但它們是通過利用大腦短期偏好來壓制你長期目標的)。
接着,重點讓超級智能變得便宜、普及,並避免被某個個人、公司或國家高度集中掌控。社會具有韌性、創造力,也能迅速適應。
如果我們能激發集體的意志和智慧,儘管會犯錯、也會有失控,但我們會迅速學習與調整,從而最大化收益、最小化風險。在社會廣泛設定的框架下,給予用戶更多自由將非常關鍵。世界越早開始關於這些框架及「集體對齊」如何定義的討論,就越好。
我們(整個行業,不只是 openai)正在為世界構建一個「大腦」。
這個大腦將高度個性化、人人易用;它的極限將取決於我們的好點子。長期以來,技術圈總愛嘲笑那些「只有想法的人」——他們有個點子,卻沒法實現。而現在,看起來他們的時代終於要到了。
openai 如今做的事情很多,但最根本的身份仍是一個超級智能研究公司。我們還有大量工作要做,但前路已經被照亮,黑暗正迅速退去。我們對能做這些事情感到無比感激。
「智能幾乎免費」已近在眼前。也許聽起來瘋狂,但如果我們在 2020 年告訴你我們將在 2025 年到達現在這個水平,聽起來比我們現在對 2030 年的預測更瘋狂。
願我們順利、指數級、平穩地邁入超級智能時代。
剛剛,OpenAI 發布 o3-pro,開源模型推遲,奧特曼髮長文:溫和的奇點 - 天天要聞
歡迎加入 appso ai 社群,一起暢聊 ai 產品,獲取#ai有用功,解鎖更多 ai 新知👇

動漫分類資訊推薦

我是天界鳳族小公主,千嬌萬寵,一出生就與天族太子有了婚約 - 天天要聞

我是天界鳳族小公主,千嬌萬寵,一出生就與天族太子有了婚約

我是天界鳳族小公主。一出生,就被天后定下了與天族太子伏祇的婚約。可是,太子伏祇下凡歷劫歸來,卻帶回來一名凡人女子。為了這凡人女子,甚至想退了與我的婚約。可是,後來,他又哀求我嫁給他。1我是天界鳳族唯一的小公主。據說,我破殼的那一日,彩霞漫天
封面寵物聯“萌”正在集結,邀你帶崽來show! - 天天要聞

封面寵物聯“萌”正在集結,邀你帶崽來show!

封面寵物聯“萌”正在集結 邀你帶崽來show! 淘氣的藍貓,呆萌的加菲,頑皮的金毛,帥氣的邊牧,聰明的垂耳兔,機敏的虎皮鸚鵡…… 數百隻萌寵正集結在此,以封面寵物聯“萌”之名,邀....
超8500萬元稅惠紅利澆築樂高樂園,上海稅務護航重大項目“加速跑” - 天天要聞

超8500萬元稅惠紅利澆築樂高樂園,上海稅務護航重大項目“加速跑”

八大主題區,超75個互動騎乘設施、演出和主題景點,以及由超8500萬塊樂高積木拼搭而成的數千個樂高模型……備受期待的全國首座樂高主題樂園即將於7月正式開園。作為今年上海市重大工程項目之一,在樂高樂園建設過程中,上海市稅務部門圍繞建設周期,充分發揮稅收職能作用,“一企一策”提供涉稅服務和政策支撐,護航重大項...
愛奇藝舉辦第五屆“金豪筆編劇之夜” 62位編劇20部作品獲表彰 - 天天要聞

愛奇藝舉辦第五屆“金豪筆編劇之夜” 62位編劇20部作品獲表彰

6月11日,由中國文聯電影藝術中心、中國動畫學會、中廣聯合會電視劇編劇委員會指導,愛奇藝主辦的第五屆“金豪筆編劇之夜”在北京圓滿舉行。專業評委綜合此前入圍編劇和作品在思想立意、藝術品格、內容創新、市場反響等多方面考量,最終評選齣電影、動畫、劇集三大單元的62位優秀編劇和20部優秀作品,於活動當天進行了榮譽...
未經許可AI化使用他人聲音 侵權方被判賠25萬元 - 天天要聞

未經許可AI化使用他人聲音 侵權方被判賠25萬元

6月12日,最高人民法院發布利用網絡、信息技術侵害人格權典型案例,其中包含“換臉”以及“AI聲音侵權”案例。▲圖據視覺中國據介紹,某軟件運營公司開發運營一款軟件,用於供付費會員使用他人的照片進行面部替換(俗稱“換臉”),進而生成面部為他人的作品。該公司未經彭某某同意,自行在軟件中上架彭某某的肖像供會員“...
《潛淵》:“天蠍”終於現身,原來這才是他不殺梁朔的真相 - 天天要聞

《潛淵》:“天蠍”終於現身,原來這才是他不殺梁朔的真相

《潛淵》是一部諜戰懸疑劇,講述了我地下黨工作者梁朔在一次行動中失憶,周旋於日本人,76號,軍統之間,最終找回身份,粉碎陰謀的故事。通過會議室的審訊,梁朔躲過一劫,但危險遠遠沒有解除。在76號這種地方,在日本人的眼皮底下,想要活下去,不但不能
歧路旅人大陸的霸者:0612版本要點,捶主線換狐狸,刷逢魔升裝備 - 天天要聞

歧路旅人大陸的霸者:0612版本要點,捶主線換狐狸,刷逢魔升裝備

《歧路旅人大陸的霸者》6月12日版本要點如下:6星歐修提實裝,捶主線換狐狸,刷逢魔升裝備,兩個宿敵和兩個職業塔,朋友們可對照上述內容自行安排完成順序;接下來G哥會開始水字數,如果朋友們有急事可帶好隨身物品從後門離開,不着急的朋友可以繼續看看G哥如何浪費大家10分鐘的時間。首先是主線劇情索里斯帝亞第二章以及各...
打了四十年的洋麻將:戲如人生局局新 - 天天要聞

打了四十年的洋麻將:戲如人生局局新

◎黃哲 1985年首演的《洋麻將》,之於北京人藝有着開啟大劇場舞台“兩個人的話劇”這一門類的里程碑意義。這出美國著名劇作家柯培恩榮獲1978年普利策戲劇獎的代表作,當年由....