理想汽車VLA司機大模型 在成長中持續解決行業問題

2025年05月07日21:50:21 汽車 7286

2025年5月7日,理想汽車推出“理想ai talk第二季——理想vla司機大模型,從動物進化到人類”,理想汽車董事長兼ceo李想重點分享了對於人工智能的最新思考,vla司機大模型的作用、訓練方法和挑戰,以及對於創業和個人成長的見解。

李想將ai工具分為三個層級,分別是信息工具、輔助工具和生產工具。目前,大多數人將ai作為信息工具使用,但信息工具常伴隨大量無效信息、無效結果和無效結論,僅具參考價值。成為輔助工具後,ai可以提升效率,例如現在的輔助駕駛,但仍需人類參與。未來,ai發展為生產工具後,將能獨立完成專業任務,顯著提升效率與質量。

李想表示:“判斷agent(智能體)是否真正智能,關鍵在於它是否成為生產工具。只有當人工智能變成生產工具,才是其真正爆發的時刻。就像人類會僱傭司機,人工智能技術最終也會承擔類似職責,成為真正的生產工具。”理想汽車VLA司機大模型 在成長中持續解決行業問題 - 天天要聞

 

vla的實現不是突變的過程,是進化的過程

目前的l2、l2+組合駕駛輔助仍屬於輔助工具階段,而vla(vision-language-action model,視覺語言行動模型)能夠讓ai真正成為司機,成為交通領域的專業生產工具。對理想汽車而言, 未來的vla就是一個像人類司機一樣工作的司機大模型”。

vla的實現不是一個突變的過程,是進化的過程,經歷了三個階段,對應理想汽車輔助駕駛的昨天、今天和明天。第一階段,理想汽車自2021年起自研依賴規則算法和高精地圖的輔助駕駛,類似“昆蟲動物智能”。第二階段,理想汽車自2023年起研究,並於2024年正式推送的端到端+vlm(vision language model,視覺語言模型)輔助駕駛,接近“哺乳動物智能”。

端到端模型在處理複雜問題時存在局限,雖可藉助vlm視覺語言模型輔助,但vlm使用開源模型,使其在交通領域的能力有限。同時端到端模型也難以與人類溝通。為了解決這些問題並提升用戶的智能體驗,理想汽車自2024年起開展vla研究,並在多項頂級學術會議上發表論文,夯實了理論基礎。

在端到端的基礎上,到第三階段,vla將開啟“人類智能”的階段。它能通過3d和2d視覺的組合,完整地看到物理世界,而不像vlm僅能解析2d圖像。同時,vla擁有完整的腦系統,具備語言、cot(chain of thought,思維鏈)推理能力,既能看,也能理解並真正執行行動,符合人類的運作方式。

理想汽車VLA司機大模型 在成長中持續解決行業問題 - 天天要聞

 

vla訓練過程模擬人類學習,對齊人類價值觀

vla的訓練分為預訓練、後訓練和強化訓練三個環節,類似於人類學習駕駛技能的過程。預訓練相當於人類學習物理世界和交通領域的常識,通過大量高清2d和3d vision(視覺)數據、交通相關的language(語言)語料,以及與物理世界相關的vl(vision-language,視覺和語言)聯合數據,訓練出雲端的vl基座模型,並通過蒸餾轉化為在車端高效運行的端側模型。

後訓練相當於人類去駕校學習開車的過程。隨着action(動作)數據的加入——即對周圍環境和自車駕駛行為的編碼,vl基座變為vla司機大模型。得益於短鏈條的cot,以及diffusion擴散模型對於他車軌跡和環境的預測,vla具備實時性的特點,實現了在複雜交通環境中的博弈能力。

強化訓練類似於人類在社會中實際開車練習,目標是讓vla司機大模型更加安全、舒適,對齊人類價值觀,甚至超越人類駕駛水平。強化訓練包含兩部分:一是通過rlhf(reinforcement learning from human feedback,基於人類反饋的強化學習)完成安全對齊,使模型遵守交通規則,貼合中國用戶的駕駛習慣;二是將純強化學習模型放入世界模型中訓練,提升舒適性,避免碰撞事故,遵守交通規則。經過預訓練、後訓練和強化訓練後,vla司機大模型即可部署至車端運行。

vla司機大模型以“司機agent(智能體)”的產品形態呈現,用戶可通過自然語言與司機agent溝通,跟人類司機怎麼說,就跟司機agent怎麼說。簡單通用的短指令由端側的vla直接處理,複雜指令則先由雲端的vl基座模型解析,再交由vla處理。

理想汽車VLA司機大模型 在成長中持續解決行業問題 - 天天要聞

 

超級對齊確保ai決策安全,世界模型破解ai黑盒難題

除了提升專業能力,vla司機大模型還需解決安全性和模型黑盒的問題。

模型能力越強,越需要職業性約束,以確保能力下限。為了保障vla司機大模型能夠實現職業司機般的安全和舒適,避免學習加塞等違規行為,理想汽車在強化訓練環節投入大量資源,並於2024年底組建超過100人的超級對齊團隊,相當於為司機agent注入職業素養。

為解決模型的黑盒問題,理想汽車結合重建和生成兩種路徑,打造了真實、符合物理世界規律的世界模型,覆蓋所有交通參與者和要素。基於世界模型的仿真能力,vla可以在世界模型中低成本、準確地驗證現實問題,提升解決問題的效率,有效應對模型黑盒帶來的挑戰。

判斷司機agent是否是個好司機,有三個關鍵標準:專業能力、職業能力和構建信任的能力。vla司機大模型提升了專業能力,超級對齊增強了職業能力,vla通過理解自然語言、具備記憶能力提升了構建信任的能力。

理想汽車VLA司機大模型 在成長中持續解決行業問題 - 天天要聞

 

人工智能時代,紮實的基本功比走捷徑重要

理想汽車實現技術快速躍遷的背後,是從研究、研發到能力表達,再到將能力變成業務價值的基本功積累。研究是關鍵,研究突破後,研發的效率會大幅提升,且注重價值轉化,最終實現業務落地。

理想汽車堅持自研,通過技術賦能用戶價值。例如,在輔助駕駛方面,由於英偉達orin-x芯片無法直接運行語言模型,端到端+vlm的輔助駕駛方案對部分企業來說仍具挑戰。理想汽車依託自有編譯團隊,自研底層推理引擎,使芯片可通過int4(4比特整型)量化的方式運行vlm。同時,憑藉芯片、控制器設計和自研汽車操作系統等綜合能力,理想汽車實現了讓雙orin-x芯片和thor-u芯片運行同等規模的vla司機大模型。李想表示,大型企業的基本功和能力永遠無法被逾越。

得益於deepseek的開源,理想汽車在vla司機大模型的語言能力研發上提速顯著,節省了近9個月的時間和數億元成本。儘管如此,理想汽車仍選擇加大投入,在基座模型上投入超預期3倍的訓練卡,專註打造適配多場景的自研模型。李想表示:“我們可以站在巨人的肩膀上,但它只是其中的一部分。”在受益開源的同時,理想汽車也選擇開源自研的汽車操作系統——理想星環os,回饋社會。

 

成長帶來能量,在痛苦中保持正能量

今年7月,理想汽車將迎來成立十周年。李想表示,創業路上苦多於甜,他選擇保留那些有價值的美好片段,用來激勵自己保持正能量。“創業確實不容易,但是沒必要苦哈哈的。苦和甜是一個硬幣的正反面,取決於看哪一面。”他將企業遭遇的打擊視為必須面對的挑戰,也正是這些挑戰,賦予了理想汽車更多的能力。也正因這份積極樂觀的創業心態,理想汽車才能快速成長為千億營收規模、百萬交付量的新勢力企業。

談及如何成為更有能量的人,李想認為,關鍵在於關注自我,接受自身的優點和不足,並用成長替代改變——成長意味着增強能力。除此之外,李想強調親密關係同樣重要,關注他人的成長也能帶來能量,家人和同事能夠和他形成互補,相互支撐。“我需要家人和同事甚至超過了他們需要我,首先是我需要他們,然後才是他們需要我,我們在一起能夠形成非常強的腦力和心力。”李想表示。

回顧幾次創業經歷,李想表示,從高中創辦個人網站至今,自己的思維方式沒有什麼變化:遇到問題解決問題,解決別人不願解決的難題,解決用戶的痛點,不斷向他人學習。不同的是,如今面臨的問題更複雜、服務的用戶群體更多、公司規模和組織也更龐大。“幾次創業一路走來,最難時有人相助,遇坑也能迅速爬出,一幫人齊心協力變得更好,這是種幸運,也沒什麼可後悔的。”

面對ai的發展,李想認為,在ai面前所有的人性都應被保留,無論好壞,因為一切人性都是文化、生命、性格、能力的特質,也是人類真正的生命力所在。

 

從使用增程電動和5c超充技術解決電池成本高、充電難、充電慢的問題,到自研汽車操作系統攻克傳統汽車操作系統性能差、開發緩慢、芯片匹配周期長等挑戰,理想汽車始終以技術創新解決行業無法解決的問題。自研vla時,理想汽車更是踏入了人工智能的無人區。當前,輔助駕駛走到了新的十字路口上,理想汽車將不斷挑戰成長的極限,持續為行業和用戶創造價值。

汽車分類資訊推薦

是誰加速了雷克薩斯在華國產的步伐 - 天天要聞

是誰加速了雷克薩斯在華國產的步伐

雷克薩斯國產,不是因為情願,而是被逼無奈。十年抗拒,一朝低頭,雷克薩斯終於在2025年按下國產按鈕。幕後推手,不是豐田章男的覺醒,而是一眾快倒閉的中國經銷商。從進口到國產,雷克薩斯從“尊貴”滑向“平凡”。但這不是轉型,這是保命。如今ES優惠高達10萬,賣一台虧一台,經銷商不再加價,而是虧着清庫存。2025年1-5...
豐田覺醒了!試駕鉑智3X - 天天要聞

豐田覺醒了!試駕鉑智3X

都說識時務者為俊傑,我覺得廣汽豐田就是識時務的。既然大家都說合資品牌造不好新能源,那麼它就完全對標自主品牌造了一台純電車。設計上是對標的,配置上對標,就連價格也對標,10.98萬元起。但是人家掛的是正兒八經的豐田標,這台車就是廣汽豐田的鉑智
212越野車升級款 T01檢閱官於“樂野之日”活力首秀 - 天天要聞

212越野車升級款 T01檢閱官於“樂野之日”活力首秀

6月28日,剛迎來品牌煥新一周年的212越野車在青島西海岸新區,與BUBBLING&BOILING聯袂呈現“樂野之日CRUMP FEST”越野派對。任賢齊、吳克群、崔健等十組藝人在28和29日兩天火熱開唱,升級款 T01檢閱官於活動上全新揭
成都飛行體驗地圖發布,低空經濟點燃蓉城夏日 - 天天要聞

成都飛行體驗地圖發布,低空經濟點燃蓉城夏日

6月28日下午,成都市武侯區大悅城廣場被一片科技與消費交織的熱潮籠罩,“2025成都服務消費季·天空奇遇記”主題活動啟幕。據介紹,活動將持續至8月29日,以“空-地-水”立體體驗、科技互動裝置、消費福利包等形式,讓“低空經濟”從概念走向可觸摸的生活場景。活動現場,《成都天空奇遇記·飛行體驗地圖》發布。據了解,該...
F1奧地利:諾里斯強勢奪桿位!法拉利爆發,博托萊托首闖Q3成為驚喜 - 天天要聞

F1奧地利:諾里斯強勢奪桿位!法拉利爆發,博托萊托首闖Q3成為驚喜

因F2衝刺賽事故而改於賽道時間28日16:05,於氣溫攝氏27度、賽道溫度攝氏47度晴朗環境中舉行的排位賽將作為決賽起跑順位安排標準,其中時長分別為18分鐘的Q1、15分鐘的Q2將依序淘汰最慢的5位車手,並在12分鐘的Q3決定本場大賽桿位得主。在本周沒有如先前的數場大賽採用變數大的C6配方胎、且本年大賽沒有如前幾年舉行衝刺賽下...
顏值密碼揭秘:這5種長相的男生為何總能一眼抓住女生心? - 天天要聞

顏值密碼揭秘:這5種長相的男生為何總能一眼抓住女生心?

#頭號新車#說起顏值,這個話題似乎永遠不會過時。作為一個對顏值既着迷又好奇的人,我經常在自駕游途中思考這個問題。開着我心愛的頭號新車——一輛操控精準、顏值同樣出眾的跑車,在蜿蜒的山路上馳騁時,我常常觀察路上的人和車,也揣測他們背後的故事。
中國“插混轎車”成績:續航進入2000km時代,第一名月銷1.8萬台 - 天天要聞

中國“插混轎車”成績:續航進入2000km時代,第一名月銷1.8萬台

在當今新能源汽車蓬勃發展的時代,消費者的需求日益多元化且挑剔。他們既渴望體驗新能源汽車所帶來的電動化與智能化魅力,又對車輛的續航能力有着極高的要求,期望在長途出行時無需頻繁充電。這種“既要,還要”的消費心理,正是推動插電式混動車型增長的核心
一汽豐田津門敘事 - 天天要聞

一汽豐田津門敘事

近兩年,中國汽車市場深陷內卷洪流,行業競爭日益加劇。眾多新勢力慘遭生死局,合資品牌市場份額進一步萎縮,部分外資車企不得已退出中國市場……縱使風雲變幻,一汽豐田卻是唯一連續兩年實現銷量正增長的主流合資車企。為能繼續在新能源汽車時代站穩腳跟,一汽豐田迎來里程碑式變革——6月28日,一汽豐田汽車銷售有限公司...