劃重點:
--皮查伊認為ai可能是人類歷史上最重要的技術創新,甚至可能超越農業革命和工業革命,成為最強的生產力引擎。
--儘管ai技術發展迅速,但目前仍受限於計算能力。擴展定律表明,ai模型的性能和規模仍在不斷增長。
--通用人工智慧(agi)和人工超級智能(asi)的發展可能會對人類社會產生深遠影響,但實現agi可能還需要一些時間。
--儘管ai具有巨大潛力,但也需要積極考慮其風險,相信人類能夠團結起來,避免負面結果的發生。
--ai在編程領域的應用將顯著提高程序員的生產力,使他們能夠更專註於創造性任務,同時ai工具將幫助處理繁瑣的編程工作。
--谷歌通過ai mode整合人工智慧到搜索結果中,旨在提供更豐富的上下文信息和更高效的搜索體驗,同時保持對人類創建內容的重視。
在當今這個科技飛速發展的時代,ai已經成為人類社會最引人注目的焦點之一。從改變我們的生活方式到重塑全球經濟格局,ai的影響力無處不在。在這樣的背景下,alphabet兼谷歌首席執行官桑達爾·皮查伊參加了mit研究科學家、人工智慧專家萊克斯·弗里德曼(lex fridman)的播客節目,深入探討了ai及其相關技術對人類社會的深遠影響。
這場對話涵蓋了從ai的歷史地位、未來潛力,到它在藝術、編程、搜索技術,甚至人類文明演變中的角色。皮查伊不僅分享了他對ai技術發展的深刻見解,還探討了ai如何推動人類社會的進步,以及我們如何在這個充滿機遇與挑戰的時代中找到自己的位置。通過這些討論,我們可以看到,ai不僅僅是一種技術革新,它更可能成為人類歷史上最偉大的發明之一,深刻地改變我們的未來。
01.ai在人類歷史中的影響
當問及ai是否是人類歷史上最重要的技術創新時,皮查伊勾勒出一幅人工智慧重塑人類文明的宏大圖景。「這不僅是工具迭代,而是文明層級的躍遷」,這位矽谷領袖如此定義ai革命的歷史意義。當被問及ai能否超越農業革命、工業革命成為史上最強生產力引擎時,他重申了2017年的預言:「人工智慧將是比火或電力更深刻的技術革命」。
面對「當代人是否高估新技術」的質疑,皮查伊展現出難得的辯證思維。他承認體育界常見的「現役球員崇拜」現象同樣存在於技術領域,但隨即用alphago的案例打破質疑:「當演算法用24小時走完人類圍棋三千年的進化之路時,我們見證的不是量變,而是認知維度的躍遷。」他特彆強調ai獨有的「創造性遞歸」特質—這種能不斷加速自身進化的能力,在人類工具史上確是破天荒的存在。
關於創造力解放的討論中,皮查伊將ai比作新石器時代的陶器,這個看似樸素的類比暗藏玄機:「就像陶器不僅儲存糧食更催生了貿易文明,ai將使全球80億人的思想獲得實體化表達。」當話題轉向藝術創作時,他忽然提起梅西的招牌弧線球:「機器可以完美復刻球路,但觀眾席上顫抖的雙手、發紅的眼眶,這些才是人類文明的密碼。」
在描繪未來圖景時,這位工程師出身的ceo預言十年後的孩子會像我們今天使用搜索引擎那樣自然地駕馭ai,而歷史教學將從事實背誦轉變為「與往聖先賢的跨時空共振」,「無論技術如何進化,人類必須永遠在迴路中。因為再精妙的演算法,也解不開蒙娜麗莎微笑的密碼。」
關於ai會如何釋放人類的創造力,皮查伊認為就像youtube讓無數創作者湧現一樣,ai也會讓更多人能夠表達自己。如果把20世紀50年代或40年代的人帶到今天,讓他們看看youtube,他們可能會感到震驚。同樣,現在的人力如果看到未來10到20年的發展,也會感到震驚。
02.veo 3與視頻的未來
當問及veo 3和視頻的未來時,皮查伊將ai視頻工具veo 3比作數字時代的調色盤。「達倫·阿倫諾夫斯基在20年前拍《圓周率》時,ai還是科幻概念,」他說,「如今這位先鋒導演正用veo撕裂創作邊界,如同亨特·湯普森所言—尋找邊界唯一的方式就是跨越它。」
當被問及科技巨頭如何平衡藝術自由與社會責任,皮查伊說:「我們提供的是電網而非電燈。veo和flow作為基礎設施,不該限制藝術家用電流照亮教堂還是賭場。藝術自由是文明的氧氣,阿倫諾夫斯基們拓展的不是技術邊疆,而是人類表達的宇宙維度。」
皮查伊透露,現階段gemini每月產生的token量從9.7萬億暴漲至480萬億,是80億人用好奇心鑄造的巴別圖書館。人類的好奇心是無止境的。也許有一天,我們會找到一個五個單片語成的句子,它能夠揭示宇宙的真相,或者一些非常有意義的東西。但我覺得我們還沒有到那一步。
03.擴展定律(scaling laws)
皮查伊在討論中分享了他對人工智慧擴展定律的看法。他認為,儘管描述ai擴展定律的方式多種多樣,但谷歌看到了前方巨大的發展空間,並且已經在預訓練、後訓練、測試時計算和工具使用等多個方面進行了優化和改進。這些努力讓模型更具自主性,並朝著更通用的世界模型邁進。
當被問及是否感受到任何限制,例如計算瓶頸、數據瓶頸或創意瓶頸時,皮查伊認為目前主要受限於算力。他解釋說,這也是為什麼他們推出了flash、nano、flash和pro模型,但尚未推出ultra模型。對於每一代產品,他們都能讓pro模型達到ultra模型80%到90%的能力,但ultra模型會更慢且服務成本更高。
然而,谷歌能夠在後續迭代中,讓新一代的pro模型達到上一代ultra模型的水平。
皮查伊指出:「這表明擴展定律仍然有效,但在任何給定時間,我們最常用的模型可能總是比我們能夠提供的能力最強的模型落後幾個月。因為那些最強大的模型可能速度不夠快,也不易於使用。」
他還提到,從智能的角度來看,衡量模型性能的難度越來越大。例如,gemini flash可能因為低延遲,而比pro更有影響力,因為它的智能水平已經很高了。有時,延遲可能比智能更重要。皮查伊強調:「現在我們需要開始衡量模型的實際影響力,基準測試越來越難以捕捉模型的智能水平、有效性、實用性以及在現實世界中的實際用途。」
04.agi和asi
許多人正在討論實現通用人工智慧(agi)或人工超級智能(asi)的時間表。agi大致被定義為在人類主要活動領域達到人類專家水平的能力,而asi則是agi通過自我改進迅速演變而成的,它在所有學科中的智能水平將遠遠超過人類。
皮查伊指出,還有一個現象也應該被提及,即aji(artificial jagged intelligence,鋸齒狀人工智慧),即人工智慧的發展存在不均衡——在某些方面取得了顯著進展,但仍然存在一些明顯的不足之處。
當被問及agi能否在2030年實現時,皮查伊表示,人類對agi的定義本身就在不斷變化,在今天的某些場景中,比如在舊金山街道上乘坐waymo自動駕駛汽車,人們已經能夠看到agi的影子,但整體上距離真正的agi仍有差距。他預測,到2030年,人工智慧將取得令人驚嘆的進步,但2030年可能還無法完全達到agi的水平,而是會稍晚一些實現。
皮查伊還提到,早在2010年谷歌deepmind成立之初,人們就曾預測實現agi可能需要20年時間。他強調,無論agi的具體定義是什麼,未來幾年人工智慧在許多方面的進步都將是驚人的。例如,人工智慧可能會創造出視頻內容,而人類社會需要建立某種機制來識別這些內容是由人工智慧生成的,並以某種方式披露這一點,否則人們將難以區分現實與人工智慧生成的內容。
此外,皮查伊還提到,用戶界面(ui)對於人工智慧的發展至關重要。他指出,人工智慧本身可能會在用戶界面的自我改進方面取得進展,因為這些模型能夠編寫代碼,因此它們應該能夠隨著時間的推移編寫出最好的用戶界面來表達它們的想法。
他認為,未來人工智慧將不僅僅是一個語言模型,而是一個能夠不斷改進與人類交互方式的智能系統,「這些模型是天然的多模態系統,能夠輕鬆處理任何格式的內容,並將其轉換為其他格式。」
05.末日概率(p(doom))
皮查伊在討論中被問及關於人工智慧的長期風險,特別是agi和asi可能對人類文明構成的威脅。他提到,ai社區中一些哲學家式的思考者會考慮agi和asi可能毀滅人類文明的概率,這一概念被稱為末日概率(p(doom))。當被問及他對這一問題的看法時,皮查伊表示:「我確實對ai的潛力感到非常興奮,但我也一直認為,這是一種需要積極考慮風險並努力駕馭的技術,以確保它能夠帶來積極的影響。」
他指出,鑒於ai技術的強大能力,如果能夠像管理大型組織那樣,通過激勵機制讓所有人類朝著一個共同目標努力,末日概率應驗的可能性就會很小。「我相信,如果人類能夠團結起來,我們就能解決這個問題。」
他補充說:「我認為人們往往沒有意識到,沒有ai的情況下,人類毀滅自己的概率是多少。ai反倒有可能幫助我們變得更聰明、更善良、更高效,幫助世界上更多地區繁榮發展,減少資源匱乏帶來的軍事衝突和緊張局勢。因此,我們也需要考慮沒有ai時的p(doom)是多少,因為ai有可能拯救人類文明免受其他威脅。」
06.最艱難的領導決策
皮查伊回憶起2024年的一次散步,當時外界有諸多質疑聲,甚至有分析師和專家建議他辭去谷歌ceo的職務,認為谷歌在人工智慧競賽中已經輸掉比賽,失去了魔力。然而,僅僅一年後,谷歌推出了一系列令人矚目的產品,gemini pro在多個基準測試中取得勝利,谷歌再次證明了自己的實力。
作為ceo,皮查伊的主要決策是確保公司以ai優先的方式應對一切,負責任地開發agi,並推出真正有用的產品。他提到,谷歌做出了一系列重要決策,比如將brain和deepmind團隊整合,成立谷歌deepmind,以及十年前就開始投資張量處理單元(tpu),不斷擴大規模,構建大型模型。
他比喻說,管理谷歌就像執教頂級足球隊,雖然可能會經歷低谷,但需要專註於真正重要的信號。他強調,儘管外界有很多聲音,谷歌內部始終專註於做出關鍵決策。許多日常決策並不重要,真正重要的是少數幾個關鍵決策。
當被問及谷歌做出的一些關鍵決策時,皮查伊提到deepmind和brain的合併就像把斯坦福和麻省理工兩所高校組建在一起,然後試圖創建一個偉大的高校,說起來容易做起來難。
07.ai mode vs 谷歌搜索
谷歌搜索被稱為互聯網的首頁,是一個傳奇的、極簡主義的界面,上面有10個藍色鏈接。當人們想到互聯網時,他們就會想到這個頁面。然而,谷歌現在開始改變這一傳統,推出了ai mode,這是一個單獨的標籤頁,將人工智慧整合到搜索結果中。
被問及谷歌推出ai mode的決定時,皮查伊提到,谷歌一直在根據用戶需求和技術發展不斷改進搜索體驗。ai mode的推出是因為底層技術變得更加強大,能夠提供更多的上下文信息。谷歌的一個重要設計理念是,當用戶使用谷歌搜索時,他們會得到豐富的上下文信息,但仍然可以在網上找到很多東西。這在ai mode和ai概覽(ai overviews)中也是如此。ai mode不僅提供了上下文和總結,還允許用戶與之進行對話,幫助他們在搜索過程中更好地理解信息。
皮查伊強調,儘管ai mode提供了強大的功能,但谷歌的核心原則並未改變,即為用戶提供鏈接,讓他們能夠訪問網路上的各種信息。ai mode被視為一個提供上下文和總結的附加層,幫助用戶更好地理解搜索結果。他還提到,ai mode使用了谷歌最先進的模型,這些模型將搜索作為深度工具,為每個查詢展開多個搜索,整合知識,以便用戶可以獲取他們想要的信息。
他提到,已經有數以百萬計的用戶在使用ai mode,早期的指標非常令人鼓舞。目前的計劃是將ai mode作為一個單獨的標籤頁存在。隨著功能的不斷完善,谷歌會逐步將ai mode的功能遷移到主搜索頁面。他認為,ai mode將提供最前沿的體驗,而那些經過驗證的功能將逐漸融入主搜索體驗中。他說,谷歌的目標是為用戶提供更高質量的搜索結果,同時保持對人類創建內容的重視。
商業化的問題上,皮查伊表示,廣告在谷歌的服務中扮演著重要角色,使數十億人能夠免費使用這些服務,ai mode將幫助谷歌更好地整合廣告,以一種不令人反感的方式提供商業信息。他認為,廣告的需求不會因為ai的出現而改變,但谷歌會重新思考如何更好地整合廣告,以適應ai時代的需求。
08.谷歌chrome的未來
皮查伊在討論中強調了chrome瀏覽器的重要性,認為它是他最喜歡的軟體之一,甚至可能是排名第一的軟體。他指出,chrome作為我們通往網路的窗口,多年來一直在推動瀏覽器領域的創新,即使在市場停滯時,chrome也不斷挑戰極限,提升性能和效率。
皮查伊還提到,谷歌聯合創始人拉里·佩奇和謝爾蓋·布林一直強調追求雄心勃勃的目標,即「探月計劃」。這些計劃能夠吸引頂尖人才,減少競爭對手,即使只完成部分目標,也能取得巨大成功。他以waymo(谷歌自動駕駛項目)為例,強調其成功源於團隊的堅持和對安全性的承諾。儘管競爭激烈,但他相信waymo和特斯拉都能在未來取得成功。
此外,皮查伊提到了gemini robotics(谷歌的機器人項目),這是deepmind團隊正在努力的方向。他認為,ai將在機器人領域推動巨大進步,尤其是在軟體方面。
谷歌正在努力將ai模型應用於現實世界,以安全和通用的方式工作。ai的發展將推動多個領域的進步,包括電子郵件、文檔處理和機器人技術。他以gmail為例,說明ai整合可以為用戶提供個性化回復建議,幫助用戶更高效地處理信息,從而為人類騰出更多時間去做真正有意義的事情。
09.ai對編程的影響
皮查伊在討論中被問及編程領域的現狀,特別是ai在編程中的應用。他提到,在谷歌,大約30%的代碼現在使用了ai生成的建議,預估ai已經使公司的工程效率提高了10%。儘管如此,谷歌計劃在明年招聘更多的工程師,因為ai帶來的機會空間也在不斷擴大。
皮查伊認為,ai在編程中的應用將使工程師能夠更專註於設計、架構和解決問題等更具創造性的任務,騰出更多時間進行創新和團隊合作。
他認為,10%的效率提升是一個巨大的數字,尤其是在擁有數萬名工程師的大型組織中。他強調,ai不僅提高了代碼的生成量,更重要的是提高了實際的工程生產力。尤其是能夠幫助改善谷歌的代碼庫,使其更加標準化,便於工程師在代碼庫中移動和工作。這也將使ai更好地理解整個代碼庫,從而進一步提升工程效率。
最後,皮查伊被問及谷歌著名的編程面試是否因ai而改變。他指出,谷歌將確保至少有一輪面對面的面試,以確保應聘者具備基本的編程能力。他認為,能夠利用ai工具生成更好的代碼也是一種重要的技能。
09.安卓的未來
皮查伊在討論中被問及安卓的未來,尤其是在ai和擴展現實(xr)技術不斷發展的背景下。他認為,計算領域最偉大的創新往往發生在輸入輸出(io)範式轉變時,比如圖形用戶界面(gui)和移動設備上的多點觸控。他指出,增強現實是下一個重要的io範式,但ar的發展受到了系統集成挑戰和ai技術的限制。ai對於實現自然、無縫的io至關重要。
皮查伊提到,谷歌的project astra對於安卓xr世界來說至關重要。他認為,當人們使用ar眼鏡時,會發現這些設備非常有用。他強調,xr是安卓未來發展的一個重要方向,但它也為重新思考移動操作系統提供了機會。他指出,儘管應用程序和快捷方式不會消失,但操作系統需要更加智能化,能夠理解用戶的需求,學慣用戶的行為模式,並主動適應用戶。
他還提到,谷歌正在努力解決操作系統層面的問題,以確保ai能夠更好地整合到整個系統中。他強調,谷歌的目標是讓操作系統更加智能化,能夠回答用戶的基本問題,並提供無縫的用戶體驗。
皮查伊還提到了谷歌在ar眼鏡方面的進展。他透露,谷歌計劃在今年晚些時候將ar眼鏡交給開發者,並在明年推向消費者市場。
此外,皮查伊還被問及谷歌在創新過程中如何平衡嘗試新事物和放棄有潛力的項目。他指出,谷歌一直在嘗試各種創新,但有時不得不放棄一些項目,以集中精力在更重要的領域。他提到,谷歌語音(google voice)是一個他個人非常喜歡的服務,很高興它沒有被放棄。
他強調,儘管外界曾有「谷歌已經完了」的說法,但谷歌在搜索、廣告、視頻、地圖等等領域的創新和突破證明了其強大的生命力和創新能力。
10.最想問agi什麼問題
在討論中被問及如果實現了agi,他會問它什麼問題時,皮查伊透露,到那時agi可能已經智能到足夠主動,告訴用戶一些應該知道的事情。但如果他要主動提問,他希望agi能幫助人類更好地理解自己。
皮查伊進一步解釋說,從個人層面來看,agi可能會以一種深刻的方式理解個人,也可能幫助人類更好地理解宇宙,從而拓展我們對世界的認知邊界。
皮查伊說,他個人最想問agi的問題是:宇宙中到底有多少外星文明?他開玩笑說,這個問題的答案可能會讓他感到非常驚訝,其他問題還包括像外星文明是否危險,以及為什麼沒有外星文明存在等等。
他甚至提出了一個假設性的問題:如果高度智能的文明最終會自我毀滅,那麼是否因為競爭會導致軍事衝突,最終導致文明的滅亡?皮查伊還提到了費米悖論,這是一個關於外星生命存在性的悖論。他希望agi能夠提供一個真正的討論,幫助人類更好地理解這個問題。
11.人類的未來
隨著人工智慧在人類所做的一切事情上變得越來越好,皮查伊被問及他認為人類最獨特的地方是什麼。他回答說,這是一個很難回答的問題,因為人類的本質、我們的意識以及使我們獨一無二的東西,可能隨著時間的推移會變得模糊不清。但皮查伊希望,在一個資源更加豐富的世界裡,人類的價值觀,如同情心、善良等,能夠更多地體現出來。
他相信,在科學領域,儘管ai在幫助我們解決一些問題上變得越來越好,但人類仍將繼續探索科學、數學和物理問題,因為有時候問題本身才是最難的部分。他提到了與deepmind合作的早期工作,以及alphaevolve項目,這些都讓他感到非常興奮。
當被問及他對人類文明未來的希望時,皮查伊表示他是一個樂觀主義者。
他認為,人類文明一直在不斷進步,儘管在任何特定時刻都存在需要解決的大問題,但他總是問自己,如果可以選擇,他寧願出生在現在,而不是過去的任何其他時候。他認為,人類文明已經取得了非凡的成就,並且一直在讓世界變得更好。他相信,人類將始終集體努力,推動這一前沿領域向前發展,他預計未來也將是如此。(文/騰訊科技特約編譯無忌)