8月8日,robotaxi首秀。這很可能是劃時代的車。按照馬斯克的原話:它會讓特斯拉市值衝上10萬億美元。一百年後人們都會談論這個重要時刻。而馬斯克真正想要的是,通過robotaxi(自動駕駛出租車)顛覆交通運輸的現存模式。
三體引力波依照沃爾特·艾薩克森力作《馬斯克傳》美版(simon&schuster出版),選取相關章節譯成中文,為大家呈現這段不輸於編劇筆法的驚人內幕。
「它跟chatgpt一樣,只不過是給汽車使用,」自動輔助駕駛團隊成員達瓦爾·什羅夫(davar shrove)對馬斯克說。 他把自己在特斯拉的ai項目,拿來跟openai新推出的人工智能聊天機器人做比較。 openai是馬斯克和奧特曼在2015年共同創立的實驗室。馬斯克花了近十年時間,投入開發各種不同形式的人工智能,包括自動駕駛系統、人形機器人optimus、腦機接口neuralink等。什羅夫的人工智能項目主要是開發最先進的機器學習技術,也就是能夠學習人類行為的自動駕駛系統,他說:「我們處理了大量信息,都是關於真實人類如何應對複雜駕駛場景,然後訓練計算機神經網絡模仿人類的駕駛行為。」
什羅夫偶爾會加入三劍客詹姆斯、安德魯、羅斯的隊列,組成四劍客。馬斯克要求和什羅夫見面,想說服他離開特斯拉自動輔助駕駛團隊,去推特工作。但什羅夫想留在特斯拉,他希望說服馬斯克,自己負責的ai項目對於特斯拉甚至整個世界來說,非常重要。他把自己提出的ai新技術,命名為「神經網絡路徑規劃器」(neural network path planner),賦予特斯拉的自動駕駛軟件向人類學習的能力。
他們兩人原定在2022年12月2日周五見面,實際上馬斯克當天的行程已經排滿,只能硬塞。當天早上,什羅夫按照馬斯克的要求抵達推特總部,馬斯克剛參加完 cybertruck 賽博皮卡發布會,從內華達趕回。他向什羅夫道歉,表示自己忘記了要飛到新奧爾良和法國總統馬克龍會面,需要討論歐洲的內容審核規則。他請什羅夫當天傍晚再來面談。當馬斯克等待與馬克龍會面期間,發消息給什羅夫,再次要求推遲面談時間。「我會遲到四個小時,你願意等我嗎?」但就在同一時間,他又突如其來地發消息給獨立調查記者維斯夫婦,請他們當晚飛到舊金山與他會面,協助處理推特文件。
當天深夜,馬斯克回到舊金山,終於有機會坐下來與什羅夫談一談。什羅夫解釋了,他正在開發的神經網絡路徑規劃器項目諸多細節。 「我認為,讓我繼續進行目前的工作,真的非常重要。」什羅夫說。 馬斯克聽了他的解釋後,再次燃起對這個ai項目的熱情,也認同什羅夫的說法。他知道,未來特斯拉不只是一家汽車公司,也不只是一家清潔能源公司。如果能夠整合全自動駕駛、optimus 機器人、dojo 機器學習超級計算機,它會成為一家人工智能公司,不僅能通過聊天機器人在虛擬世界運行,還能在實體工廠與現實道路上運行。 他早已在考慮聘請一批人工智能專家,與openai正面對決,特斯拉的神經網絡路徑規劃團隊正好能填補這份工作。
多年來,特斯拉的自動輔助駕駛系統一向採取基於規則的算法(rule-based approach)。系統由攝像頭採集視覺數據,辨識車道標線、行人、車輛、交通信號等,以及八個攝像頭拍到的視頻信息。接着,軟件會根據一套規則運行,例如:紅燈亮時要停車,綠燈亮時要開車;保持在車道標線中間;不能跨越雙黃線駛入對向車道;只在其他任何車輛的速度都不足以撞到你時,才通過路口等等。特斯拉工程師手動編寫和更新幾十萬行 c++ 代碼,把這些規則應用在各種複雜情境里。
而什羅夫正在開發的神經網絡路徑規劃器項目,可以為軟件系統增加新能力。「汽車不再只根據規則決定適合的路徑,」什羅夫說,「還會依賴神經網絡。神經網絡是根據數百萬個人類行為的真實案例計算機進行深度學習。」換個說法,神經網絡會模仿人類。每當面對某個情境,神經網絡會根據人類在成千上萬種類似情境的行為,選擇其中一條路徑。就跟人類學習說話、開車、下棋、吃意麵……幾乎所有事情一樣,我們會遵循某套既定規則,但多數時候,我們都是觀察其他人怎麼做逐漸學會技能。這是計算機科學之父圖靈在1950年發表的《計算機與智能》論文中,設想的機器學習方法。
特斯拉擁有全球名列前茅的強大超級計算機,用來訓練神經網絡,採用芯片大廠英偉達(nvidia)設計的圖形處理器(gpu)。馬斯克的目標是在2023年改用dojo,也就是特斯拉從零打造的超級計算機,用視覺數據訓練人工智能系統。dojo用的芯片和基礎設備,全都是特斯拉人工智能團隊自主設計的,算力高達每秒約800億億次浮點運算,是全球性能最強大的人工智能超級計算機之一 。這台超級計算機能用來訓練自動駕駛軟件和optimu人形機器人。「能夠同時訓練它們真的很有趣,就好像它們正在努力探索世界。」馬斯克說。
2023年初,神經網絡路徑規劃器項目已經分析了從特斯拉用戶車上採集的1,000萬幀視頻畫面。這是不是意味着系統的表現只能達到一般人類駕駛的平均水準呢?「不是,因為我們只採用了人類成功應對某個情境的數據。」什羅夫解釋。人類標記員會評估所有視頻畫面,然後給出評分,許多標記員的工作地點在紐約水牛城。馬斯克告訴他們,找出「uber五星駕駛員所採取的操作行為」,然後利用這些視頻訓練計算機。
馬斯克會定期巡視特斯拉位於加州帕羅奧圖的辦公大樓,自動輔助駕駛團隊就在其中一個開放空間工作。有時他會半蹲在一旁,跟工程師即興討論。有一天,什羅夫向馬斯克展示他們最新的開發進度。馬斯克覺得很不錯,但有個根本問題:真的需要採用這個新方法嗎?會不會有點過了頭?他有個座右銘:絕不用巡航導彈打蒼蠅,用蒼蠅拍就夠了。採用神經網絡規劃路徑器,只為了應對不太可能發生的極端情況,是否過度複雜而沒有必要?
什羅夫向馬斯克展示,在哪些情況下,神經網絡算法的表現會優於規則算法。在一個模擬場景中,道路上散布着垃圾箱、掉落的交通錐,以及任意丟棄的垃圾。由神經網絡路徑規劃器引導的汽車,必要時會打破一些規則,跨越車道線,由此避開障礙物。「當我們從規則算法轉為神經網絡時,就能做到這一點,」什羅夫對馬斯克說,「如果使用神經網絡,汽車永遠不會撞到任何東西,即使是在混亂的場景里。」每次看到類似的技術大跨越,馬斯克就會變得異常興奮。「我們應該舉辦一場詹姆斯·邦德風格的展示會。四周炸彈全部爆炸,ufo從天而降,然後我們的自動駕駛車疾駛而過,完全沒撞到任何東西。」他興奮說到。
機器學習系統在自行訓練時,通常需要有目標或指標做為引導。馬斯克偏愛的管理方法,正好是直接指定哪些指標最重要。他告訴團隊的指標是:使用特斯拉全自動輔助駕駛的汽車,在沒有人為干預下的行駛里程。「我希望每次開會時,第一張投影能夠顯示最新的沒有人為干預的里程數,」他下令,「當我們訓練人工智能時,要優化的目標是什麼?答案是提高兩次人為干預之間的里程數。」他告訴開發團隊, 要像電玩遊戲一樣,讓玩家每天都可以看到分數,「看不到分數的電玩遊戲很無聊。如果每天都能看到沒有人為干預的里程數持續增加 ,就會讓大家更有動力。」
於是團隊成員在工作間安裝了幾台巨大的85吋顯示屏,實時顯示全自動輔助駕駛汽車在不受人為干預下,平均能行駛多少里程。每當他們看到某種類型的干預行為反覆出現,例如駕駛員在變換車道、車道合併或轉入複雜路口時把握了方向盤,他們就會同時啟用規則算法和神經網絡算法,試着找到最優解。他們在辦公區擺了一面銅鑼,每當成功解決人為干預的問題時,就敲鑼慶祝。
▲特斯拉ai技術主管pariljain稱,全自動駕駛系統(fsd)已在美國200萬輛特斯拉車上使用,輔助駕駛系統(autopilot)正在全球600多萬輛特斯拉車上運行。
2023年4月中旬,馬斯克決定親自測試一下新的神經網絡路徑規劃器,讓測試車在帕羅奧圖市區繞行。什羅夫和自動輔助駕駛團隊已經裝配好一輛測試版特斯拉,內置的自動駕駛軟件接受過神經網絡訓練,有能力模仿人類駕駛行為。在這個軟件里,遵循基於規則的傳統代碼佔比非常低。馬斯克坐在駕駛座,旁邊坐着的是自動輔助駕駛軟件總監阿肖克·埃盧斯瓦米(ashok elluswamy)。什羅夫與其他兩位團隊成員馬特·鮑赫(matt bauch)和克里斯·佩恩(chris payne)坐在后座,他們三人已在特斯拉工作了八年,辦公桌彼此相鄰,都住在舊金山,住宅只隔幾個街區。多數人的辦公桌上都會擺放家人照片,他們三人的辦公桌卻放着同一張照片:那是三人在萬聖節派對的合影。堂弟詹姆斯·馬斯克曾是這個團隊的第四名成員,在馬斯克收購推特後被緊急徵調過去。而什羅夫逃過一劫。
當測試小組離開特斯拉帕羅奧圖辦公園區的停車場時,馬斯克在地圖上選定一個行駛目的地,點擊了全自動輔助駕駛模式,然後雙手離開方向盤。當測試車駛入主要幹道時,立即面臨第一個嚇人挑戰:一個騎車人正朝向他們而來。「我們所有人都屏住呼吸,因為騎車人會做出什麼隨機反應,很難預料。」什羅夫說。但馬斯克一點也沒在意,也沒有把手放回方向盤。結果這台車自動禮讓騎車人先行。「完全是真人駕駛會採取的做法。」
什羅夫和他的兩位團隊成員開始詳細解說,他們如何從特斯拉車載攝像頭搜集的數百萬條視頻片段,才訓練出來全自動輔助駕駛軟件。相比於採用人工編寫代碼、設定數千條規則的傳統算法,新的軟件架構簡單很多。什羅夫說,「它的運行速度快了10倍,我們最終還直接刪除了30萬行代碼。」鮑赫表示,這就好比人工智能機器人在玩某種極其無聊的電玩遊戲。馬斯克聽了,撲哧笑了出來。測試車繼續在車流中自主行駛,馬斯克掏出手機,開始發推文。
測試車行駛了25分鐘,經過大街小巷,完成複雜的轉彎,成功避開騎車人、行人、寵物。行駛過程中,馬斯克完全沒有碰觸方向盤,只有幾次踩了油門,因為他覺得這台車過分謹慎。例如,在四向停車信號前過分遵守規則。但有時候,測試車一度採取的應變行動,甚至讓馬斯克覺得比自己可能做出的反應還要好。他說:「哇,太棒了,即使是我的人類神經網絡,都可能反應不過來,但是這台車做得太棒了。」他實在太開心了,開始吹口哨,吹着莫札特的g大調《小夜曲》。
坐擁特斯拉、推特兩大數據庫的馬斯克,對在場的所有人說:「各位做得太棒了,真的非常了不起。」接着,所有人一起參加自動輔助駕駛團隊的周例會,20名成員幾乎全穿着黑色t恤,圍着會議桌而坐,聆聽最終評判。很多人原本不相信神經網絡項目能成功。馬斯克宣布,現在他相信了,他們應該投入大量資源,繼續推動這個項目。
討論過程中,馬斯克抓住團隊提到的一個關鍵點:神經網絡必須接受至少100萬條視頻片段的訓練,才能運行順暢,如果訓練超過150萬條,就會表現得非常優異。這意味着相比於其他車廠和人工智能公司,特斯拉擁有極大的競爭優勢。因為特斯拉每天能從全球200萬台電動車上,採集到數十億幀視頻。「在這點上,我們佔有獨一無二的優勢。」自動輔助駕駛軟件總監埃盧斯瓦米在會議上說。
不論是開發哪種人工智能,從自動駕駛汽車到optimus人形機器人,再到類似chatgpt的聊天機器人,都必須具備搜集與分析大量即時信息的能力。現在,馬斯克已擁有兩個強大的即時信息庫:自動駕駛車輛的海量視頻,以及推特平台上每周高達數十億條推文。會上馬斯克告訴自動輔助駕駛團隊,他剛完成一筆重要採購案,是為推特購買了上萬塊gpu芯片。他同時宣布未來將增加開會次數,討論特斯拉正在設計的dojo芯片,dojo芯片有望展現更強大的能力。他還懊悔地承認,自己不該在聖誕節期間,衝動下令關閉推特位於薩克拉門托的數據中心。
在那天會議中參加旁聽的,還有一位人工智能領域的超級明星工程師。那一周馬斯克剛把他挖來,準備投身於即將推出的秘密項目。未完待續