Claude 4六個月內發布!Anthropic聯創Kaplan:AGI兩三年內到來

2025年04月12日13:30:29 動漫 4868

Claude 4六個月內發布!Anthropic聯創Kaplan:AGI兩三年內到來 - 天天要聞



  新智元報道  

編輯:犀牛
【新智元導讀】anthropic聯合創始人兼首席科學家jared kaplan拋出重磅預測:人類水平的ai(agi)可能在2-3年內實現,而非此前預計的2030年。從ai能力的飛速擴展到claude 4的即將發布,再到deepseek等全球競爭者的崛起,kaplan為我們揭示了ai領域的最新突破與挑戰。

提到anthropic,大家首先想到的可能是它的聯合創始人、ceo dario amodei。

這位明星ceo經常出現在各種場合,不時拋出一個「爆炸」言論。

不過,anthropic的另一位聯合創始人,也是他們的首席科學家jared kaplan則鮮少露面。

近日,他參加了azeem azhar的一檔訪談節目,並拋出了一個與dario類似的觀點。

「人類水平的人工智慧兩三年內就會到來,不用等到2030年。」

這位略顯神秘的大佬表示,ai現在能夠處理的任務愈加複雜,甚至有些任務連人類專家也需要花費幾個小時,甚至幾天才能完成。


Claude 4六個月內發布!Anthropic聯創Kaplan:AGI兩三年內到來 - 天天要聞
agi時間表


kaplan曾在去年預測實現人類水平的ai(agi)需要到2030年,但現在他更傾向於2到3年內到來。

Claude 4六個月內發布!Anthropic聯創Kaplan:AGI兩三年內到來 - 天天要聞

不過,「人類水平」的ai並不是一個可以清晰界定的標準。

kaplan提出了衡量ai能力的兩個重要維度。

一個是ai能夠操作的環境範圍。

從最初只能在圍棋棋盤上操作的alphago,到如今可以理解文本、圖像,甚至最終可能化身為機器人進入物理世界,ai的操作範圍不斷延伸。

其二是ai能夠處理任務的複雜程度。

他回顧早期的語言模型(如bert)處理的都是1秒級的任務,比如看一個句子找出裡面的名詞。到了gpt-3,能處理的是10秒級的任務。

現在,像claude 3.7 sonet這樣的最新模型,已經能夠完成人類研究生需花費半天的複雜任務,例如分析和提煉長達20,000字的文本。

ai在這兩個維度上都快速地擴展。

kaplan表示,ai能力的快速提升有多種因素:

  • 模型智能的整體提升使其能夠關注和處理更多不同的問題。

  • 上下文窗口長度的持續擴展使ai能夠理解和處理更長的文本,從段落到書籍,從而增強其理解能力。

  • 通過強化學習訓練ai執行更複雜的任務。


Claude 4六個月內發布!Anthropic聯創Kaplan:AGI兩三年內到來 - 天天要聞
claude 4六個月內發布


claude 3已經發布了一年多的時間,kaplan預計新一代的claude 4將會在接下來的六個月內發布。

Claude 4六個月內發布!Anthropic聯創Kaplan:AGI兩三年內到來 - 天天要聞

「一方面,我們在後訓練跟強化學習上有了改進,讓claude能通過更多測試;另一方面,我們從預訓練中提升了效率。」kaplan說,短期內這種勢頭不會減慢。

對於測試時擴展(test-time scaling),kaplan覺得這是個大突破。

簡單來說,就是讓ai多想一會兒,性能就能可預測地變好,尤其是在那種光靠思考就能提高表現的困難問題上。

比如讓claude 3.7想2000個token、4000個token、8000個token,每次思考量翻倍,性能就能穩定提升。

這種方式還能擴展到同時生成好幾個答案,然後讓ai挑個最好的。

kaplan解釋說:「對於特別難的任務,你可以選一個更聰明的模型快速搞定,或者讓一個普通點的模型多花點時間,效果可能差不多。」

不過這也帶來了新挑戰:模型得學會判斷什麼時候多想一會兒。

kaplan打了個比方:「就像你剛換了個新工作,老闆給你個難題,你肯定得花大把時間琢磨,因為你想答對,不想被炒魷魚。但一旦你適應這個工作,可能隨手就給出一個答案。」


Claude 4六個月內發布!Anthropic聯創Kaplan:AGI兩三年內到來 - 天天要聞
deepseek沒理由落後


deepseek發布的r1模型引發全球熱議,展現出了令人驚艷的推理能力。

kaplan對此並不意外,「我關注deepseek的進展至少有一年半了。他們一直在發表論文、優化模型,所以這對我們或anthropic來說並不算太大的驚喜。」

這話透露出頂尖ai實驗室之間對彼此的研究非常的熟悉。

他倒覺得全球的反應挺有趣:「很多人驚呼,『哇,中國竟然有這麼厲害的模型!』我跟一些美國人聊過,他們過去總覺得中國可能落後好幾年。但看看deepseek的論文,他們的進展其實很明顯,可能只差六個月,不會太遠。」

這也反映出中美兩國在ai發展方面的差距正在縮小。

kaplan表示,ai研究的突破來得特別快。這種飛速進步不是因為科學家突然變聰明了,而是因為ai這個領域就像個秋天的果園,掛滿了低垂的果子,迭代改進的空間很大。

他進一步說,算力硬體限制可能會讓西方公司在硬體資源上佔優,這對deepseek和其他公司來說可能是個挑戰。

但在演算法本身上,所有頂尖ai公司都在找簡單、有效、可擴展的方法。

deepseek的論文里也提到了這些思路和技術,他們在演算法上完全有競爭力,沒理由落後。


Claude 4六個月內發布!Anthropic聯創Kaplan:AGI兩三年內到來 - 天天要聞
ai的影響

訪談的最後聚焦在了ai對經濟和社會的潛在影響上。

ai對生產力和勞動力市場的影響,可能會比歷史上的任何重大技術變革來得更快。

kaplan對此深以為然,他坦言:「我覺得我們對ai會如何改變社會和生產力的思考,可能遠遠不夠。隨著ai能夠完成的事情越來越多,人類可能會通過其他活動,或者用ai來放大自己的能力來實現不同。」

他同時強調了實證研究的關鍵作用。

比如ai是起到互補作用?還是提升了生產力?它會在多大程度上替代原本由人完成的任務?kaplan說他們正把這些數據開放給經濟學家去分析。

他還特別提到ai在軟體工程領域的應用,拋出了一個更深層次的問題:「像我們在軟體工程中看到的這麼多人用ai,這種趨勢會擴散到所有知識工作嗎?還是會慢得多?它又會怎樣滲透進我們的日常生活?」

從claude 4的突破到deepseek的異軍突起,全球ai競賽正以前所未有的速度推進。

它將如何改變我們的工作、生活乃至整個世界?

正如kaplan所言,答案或許藏在數據與實證研究中,而我們每個人都將是這場變革的見證者和參與者。

參考資料:
https://www.youtube.com/watch?v=tc_3kayli4u

動漫分類資訊推薦

第三百八十八章:大禮 - 天天要聞

第三百八十八章:大禮

「開心嗎?」葉辰在電話那頭低聲問道。 「能不開心嗎?」孫羽反問道,他是咬著牙說出來了,葉辰隔著電話都能想像到孫羽瘋狂的表情。 「老闆······」葉辰學著剛才聽到的聲音撒嬌道,「幫了你這麼大忙,怎麼謝我?」 感覺到孫羽沒心思開玩笑,葉辰又說
第100章 吻 - 天天要聞

第100章 吻

從魏以彤家小區出來,方弘義匆匆打了個的就往家走去。 路上,想起魏以彤剛才說的話,方弘義就不免有些頭大。 這個小丫頭……真是胡來,這種話是能隨便說的嗎?
【記者走基層】興隆局公司青峰環志站:用熱愛守護73萬隻候鳥的遷徙密碼 - 天天要聞

【記者走基層】興隆局公司青峰環志站:用熱愛守護73萬隻候鳥的遷徙密碼

「長尾雀在青峰環志之後7天,就在大連再次被環志,那就7天飛了1300多公里唄。」「春天咱們環志的鳥,第二年秋天在瑞典發現,就一個遷徙季,就飛了2萬多公里。」「咱們環志過10年前環志的長尾雀,說明這個鳥壽命是可以超過10年的。」……看視頻 點這裡這些是近日記者在興隆林業局有限公司青峰鳥類保護環志站採訪時,隨手記下...
周雨:龍隊訓練我們不好意思叫副主席 等他穿西裝我們就叫龍副主席 - 天天要聞

周雨:龍隊訓練我們不好意思叫副主席 等他穿西裝我們就叫龍副主席

5月9日消息,日前,國乒結束了多哈世錦賽前的成都封閉集訓,據國乒陪練周雨在直播中談到了叫馬龍龍隊還是龍副主席的話題。本次國乒在成都進行多哈世乒賽的封閉集訓,馬龍雖然並未入選多哈世乒賽的參賽名單,而且剛剛成為了中國乒協的副主席,但是仍然和所有參賽隊員一樣進行了嚴格的訓練,以身作則,也讓所有隊員和陪練非常...
《三體》之後,如何再造頭部科幻IP?2025「中國科幻之都」網路創意文化節在蓉啟動 - 天天要聞

《三體》之後,如何再造頭部科幻IP?2025「中國科幻之都」網路創意文化節在蓉啟動

「成都是中國地理上的窪地,卻是中國科幻的高地」,曾經一句經典評價,生動說明了成都在中國科幻圈的地位。5月9日,為擦亮成都「科幻之都」城市名片,由成都市互聯網信息辦公室、成都市成華區互聯網信息辦公室指導,成都市互聯網文化協會主辦的宇宙盡頭的迴廊——2025「中國科幻之都」網路創意文化節在望平坊啟幕。據悉,本...
極米RS 20系列:用「無損4K+電競性能」爭奪家庭娛樂「新入口」 - 天天要聞

極米RS 20系列:用「無損4K+電競性能」爭奪家庭娛樂「新入口」

當家庭娛樂場景從「單一觀影」向「多元沉浸」躍遷,投影儀的角色正在發生根本性變革。5月8日,國內投影行業龍頭極米科技發布RS 20系列新品,以無損4K畫質、電競級性能參數、全場景色彩解決方案為核心賣點,試圖重新定義家用投影儀的體驗邊界。這不僅是極米在高端技術領域的又一次突破,更是一場關於「家庭娛樂中樞」的卡位...
85後家庭大六座SUV之爭 深藍S09對比理想L8 誰的表現更稱職? - 天天要聞

85後家庭大六座SUV之爭 深藍S09對比理想L8 誰的表現更稱職?

隨著二胎家庭的增多,國內迎來了新一輪的換車潮,大家庭用戶成為了換車主力軍,他們渴望一輛既能彰顯身份與品味,又能滿足全家出行需求的高品質座駕。近期公布價格權益的深藍S09是一台為85後年輕家庭打造的大六座SUV,這款車在空間靈活性、舒適性、智能化等方面表現不錯,不少消費者都在它與理想L8之間猶豫不決,為此,我們...
美輪和音《貪婪之羊》不可思議的恐怖故事 - 天天要聞

美輪和音《貪婪之羊》不可思議的恐怖故事

五個中短篇小說,都市傳說+心理驚悚+抑壓推理,書寫暗流涌動的人性,引發令人脊背發涼的恐懼,展現扭曲詭魅而獨具美感的世界觀。病嬌系人物,字裡行間的敘述陷阱,多重伏筆編織的惡意旋渦。貪婪之羊全篇一個人的話語到底,帶著一種詭魅的氣氛。那是一個有錢