
智能座艙戰場,第一次瀰漫出「群雄環伺」的殺氣。
ai 座艙的主旋律之下,不止一家企業喊出「龍蝦」、「agent」上車,也不止一家企業自稱造出「中國版 grok」。
但至少一點,智能座艙終於成了「主菜」,它與智能駕駛、動力電池層級並列,構成智能汽車新「三大件」。
只不過,大多數人都不知道這道「主菜」究竟該怎麼做。
不是堆砌複雜的車控指令,也不是接入大量娛樂生態就夠了;更不是把 ai 應用塞進車機就叫 ai 原生。這些充其量只是淺層功夫。
好比裹着糖衣的藥丸,糖衣一溶化,用戶就不願、也難以再吞下去。
如果智能座艙的目標,是讓用戶在「第三空間」里真正享受生活,它的核心命題應該是,用「真實人格」留住用戶。
這也構成了火山引擎在 ai 座艙方向上的底層判斷。
北京車展首日,火山引擎推出一套基於 agentic ai 架構的新一代汽車智能解決方案。
其核心是一個「ai 大腦」,直接顛覆了上一代「意圖分域+多 agent 協同」的語音助手架構,並首次橫向打通車控、導航、智能駕駛等關鍵功能域。

產品形態分為兩條路徑:
ai 座艙套件。在既有、已規模量產的「豆包大模型」座艙能力基礎上,完成向 agentic 架構的升級。車企可以按需組合能力模塊,更像是在調用一套可編排的 ai 基礎設施。
豆包座艙助手方案。一種更接近「交付即用」的產品形態,與豆包 app 實現能力與數據的互通,使車內外體驗形成連續體,並通過統一模型持續迭代。
這套架構背後,是一整套從感知、推理到執行、記憶、學習的系統級閉環。既打通了整車數據鏈路,也讓模型具備長期學習與穩定控制能力。
火山引擎圍繞行業首個全鏈路端到端 ai 座艙架構展開探索,並以「ai 大腦」的思路推進 ai 原生座艙的系統化落地,率先在這一方向完成了能力卡位。
01
「糖衣」失效,
智能座艙的內核是「人格」
過去三年,智能座艙的發展,有點像在原地打轉。
車企的打法倒是很統一,在一塊中控大屏上,加一套語音系統,然後不斷往裡疊加功能,包括車控指令、娛樂 app、在線服務等。
對外敘事也固化了。
找一輛上世紀生產的經典 bba 作對比,過去機械按鍵密集、交互複雜,現在一塊中控屏管所有,語音可以調溫度、座椅和音樂。
最後粗暴得出結論,bba 已經過時,這才叫智能座艙。
現在看,這套邏輯只能成立一半。
用戶確實擺脫了早期車機的遲鈍和封閉,但新問題在於,這套以大屏和語音為核心的體系,用戶並沒有真正高頻使用。
市研機構 j.d. power 發佈的《2025 中國智能座艙評選白皮書》提供了一個 c 端視角。
在用戶滿意度排序中,語音助手已經落到倒數第四名。排在前面的,是智能座椅、充電體驗,以及更偏「物理感受」的功能。

一個直觀結論,相比可對話,用戶更在意可感知、可兌現的實際體驗。
在火山引擎副總裁楊立偉看來,如果智能駕駛大約在 80 分水平,那麼智能座艙只能得 45 分。
問題出在解題思路上,過去主流廠商的思路是用加法解決問題,功能不斷疊加,但交互邏輯沒有本質變化:
第一,觸控板菜單變成語音版菜單。
語音系統的能力在增強,但使用方式沒有改變。用戶仍然需要組織明確指令,甚至接近「標準句式」。一旦表達偏離預設路徑,系統就會出現識別失敗或響應遲緩。
第二,生態無效擴充。
視頻、遊戲、k 歌等內容被持續引入車機系統,以為能用互聯網內容提升用戶使用時長。
但低估一點,車機並不是一個內容優先的設備,手機完成生態積累與用戶習慣培養後,車機很難在同一維度競爭,就像用戶絕對不會因為在車裡能刷短視頻就放下手機。
大多時候,車機更像是手機的一個替代選項,而非首選入口。
第三,無意義的 ai 外掛。
去年初一波「deepseek 上車」熱潮,後續水花減弱。本質原因就是除了能落地對話功能,也難以做出新花樣。
ai 存在於界面中,卻沒有進入系統深層,更像是 ai 套殼座艙。
三條路徑雖擴展能力邊界,卻沒有改變交互核心,還是需要用戶主動發起操作。
功能新鮮感的「糖衣」褪去後,用戶很難對一個「沒有感情」的工具產生粘性,更何況,工具還不好用。
事實上,今天 ai 浪潮的走向,已經明示了產生用戶粘性的最佳答案。
一波是「豆包」熱,questmobile 數據顯示,截止到 2026 年 3 月,ai 原生 app 月活用戶規模已達到 4.4 億,單豆包月活用戶規模就佔到 3.45 億,斷檔第一。

而豆包脫穎而出的核心原因,在於其交互門檻足夠低,可玩性足夠強,用戶只需表達模糊意圖,都能開啟對話,並支持圖文、語音、視頻多模態輸入。
另一波是「龍蝦」潮,這類智能體可以直接接管電腦完成任務,捅破了從建議到執行的最後一層窗戶紙,進而席捲整個 ai 科技圈。
如果把兩條路徑拆開來看,會更清楚一些。前者解決的是「怎麼交流」,強調自然語義和推理能力。而龍蝦解決的是「怎麼完成」,強調目標驅動和執行能力。
兩者都具備更強的「人格特徵」,也就是理解、記憶和行動。用戶的信任和依賴,往往建立在這三點之上。
把這個邏輯放到座艙里,其實就是 ai 座艙的正確解法。
順應着這條思路,火山引擎發佈了新一代豆包座艙助手,需要強調兩點:
一是基於底層的大模型基座,只有火山引擎可以造出豆包 app 同級智力的座艙系統。
準確而言,火山引擎不是把這些能力簡單拼接起來,而是用一個「ai大腦」整合全部能力,統一處理信息,再去驅動整車各個模塊,這樣邏輯更順,也更接近 ai 原生座艙該有的形態。
02
從「拼湊智能」到「整車大腦」,
豆包座艙助手改變了什麼?
目前測試語音助手是否好用,一個常見方法是連續輸入多條指令,觀察系統能否穩定響應。
這是個有效方法,但還不夠。很多測試場景,本質還是單一領域,比如連續車控,底層依然是同一套模塊在執行。
如果需求變成「先導航到機場,再把空調調到 23 度,播放收藏的博客」,多數系統要麼漏執行,要麼明顯卡頓。
原因在於系統架構的限制。
主流車載語音方案,大多延續了移動互聯網時期的設計思路。語音先進入 nlu 模塊,被拆解為結構化意圖,再按領域分發:導航、車控、媒體、閑聊,各自對應獨立模塊處理。
跨域任務需要調度系統串聯完成,但模塊之間缺乏統一語境,只能靠規則拼接,一旦鏈路變長,就容易出錯。
這就使得,多輪對話難以跨域延續,所謂「長期記憶」也多停留在用戶畫像層。
要改變這點,底層架構得徹底顛覆。
這也是為什麼,火山引擎的方法論是「ai 大腦」,相當於用更原生的 agentic ai 方式,構建汽車 ai。
在這種新的系統組織方式上,原有的分域調度被收斂進一個統一中樞,語音、視覺、位置和車輛狀態等信息,被集中到同一模型中完成融合推理,由目標驅動引擎、對話推理引擎、學習成長引擎三大引擎推動。

效果如何?
在面向媒體開放的工程車體驗中,能清楚看到,豆包座艙助手跳出了點單、導航、對話的傳統座艙評價體系,構建出新的能力標尺——控制整車。
整車不單指車控,還包括導航、智駕、車載娛樂等原生車內場景,所以,座艙真的可以「辦事」了。
第一層能力是長程任務與推理。
類似「下班先接孩子,順路加電,再去超市,回家路上放輕音樂,下車前提醒我帶走車上的東西。」這類多步驟、跨場景的任務可以完整執行。
這種能力恰恰反映出 ai 的思考邏輯更加深刻。其它座艙思路是響應動作,但豆包座艙助手會理解意圖,即思考用戶為什麼提出這一問題,當下車內環境是什麼,再去決定如何處理。
所以同樣是哄娃,傳統座艙往往只是播放兒歌。豆包座艙助手會根據情緒狀態,組合不同方式,比如音樂、動畫和故事,形成一套更完整的安撫方案。
第二層能力是艙駕融合。
豆包座艙助手可以用「嘴」開車,比如一句「把車開到前面那個穿藍衣服的外賣小哥旁邊。」,系統可以自主泊車。具體而言,它完成了三件事:識別目標、理解語義、轉化為駕駛動作。
類似的能力,在特斯拉 grok 中也有體現,通過自然語言參與導航決策,更像一個「副駕」。
只不過,豆包大模型這一「副駕」不僅知道用戶想怎麼開,還知道該如何正確開。它會結合導航信息、路況信息影響具體路徑決策,比如凌晨夜間市區行駛時,為規避高架封路開錯,會主動提醒用戶開啟導航,同步前方路況信息。
而再往下挖一層,豆包座艙助手「辦事」聰明的能力,是被足夠自然的交互支撐起來的。
用兩個詞概括,一是鮮活,二是普適。
鮮活,指的是交互接近真實對話。支持多人發言、隨時打斷、臨時補充。語音和反饋是同步進行的,而不是一問一答的等待機制。
而普適則是降低使用門檻。沒有固定指令規則,說方言也能識別,上手成本接近於「直接開口」。

另外,由於豆包座艙助手可以多模態感知,具備更敏銳、更穩定、更安全的視覺理解能力,但又嚴格保障用戶隱私數據本地處理,隱私不出車。
值得注意的是,這一套體系,並沒有把重點放在「生態數量」上。
一方面,簡單堆疊應用,很難解決核心問題。
另一方面,生態本身並不是壁壘。無論是位元組系內容,還是第三方服務,火山引擎都可以接入。
豆包座艙助手的重點其實是回到一件更基礎的事情上:車能不能幫你把事高效辦好。
從這個角度着眼,ai大腦的意義其實更清晰了,一個可以統一理解、決策的系統,才是座艙做到「活人感」的核心基礎。
而當語音交互不再圍繞指令設計,而是圍繞目標展開,智能座艙才具備進一步演進的基礎。
03
火山引擎,後發者佔領 ai 座艙高地
相比還停留在 demo 展示階段的方案,火山引擎更早把重心放在落地。
目前,搭載豆包大模型的智能汽車已經超過 700 萬台,覆蓋 50 多個品牌、145 個車型,日均座艙交互次數超過 3000 萬,位居行業一位。

座艙能力是否成立,關鍵是用戶是否願意持續使用,顯然,火山引擎這點立住了。
合作名單也提供了一個側面。從特斯拉、奔馳這樣的頭部品牌,到國內主流車企,豆包大模型已經進入不同層級的產品體系,部分合作甚至深化到汽車雲層面。
這種趨勢在車展上更加直觀。「豆包含量」將成為高頻詞彙。
這屆車展上,梅賽德斯-奔馳純電glc、上汽奧迪e7x、上汽大眾 id. era 9x、奇瑞星途ex7、一汽紅旗hs6 phev、別克至境e7、榮威新序列「家越」等新車型,都搭載了豆包大模型。
背後對應的是兩條能力線在同時推進。
一條是座艙本身的智能化能力;另一條,則是圍繞座艙展開的服務接入能力。
火山引擎這次給出的方案,也對應這兩條路徑。
一層是「豆包座艙助手」,作為應用級產品直接輸出。車企可以獲得一套完整的交互能力和體驗體系,縮短從集成到落地的周期。
另一層是「ai 座艙套件」,輸出的是大模型底層能力。
包括模型推理、工具調用、多模態感知等模塊,車企可以根據自身需求進行定製開發。
兩套方案對應的是行業內不同的技術策略。
一部分廠商希望快速獲得成熟體驗,降低開發成本;另一部分則更關注長期能力積累,希望保留更多自研空間。火山引擎相當於扮演了一個能力平台角色。
回看火山引擎在 ai 座艙的布局路徑,可以看到一個相對清晰的節奏。雖然是後來者,但每一步都具備前瞻性。
從 2023 年入局開始,沒有跟風優先做界面或交互包裝,而是先處理底層能力。
第一步,是讓模型具備工具調用能力。
車內上千個功能接口,需要被理解並正確調度。
第二步,是引入對環境和車輛狀態的感知。
車速、位置、電量、駕駛模式等信息,被納入決策體系。
第三步,再是將這些能力整合為統一模型,形成「ai大腦」。
重構底層架構,是豆包座艙助手實現能力「湧現」的關鍵。
從行業視角看,智能座艙正在從「配置項」轉向「決策項」。系統是否理解用戶、能否在關鍵時刻做出判斷,開始直接影響體驗。
這也意味着,座艙的終局很難是一個「應用商店」。應用分發依賴用戶主動選擇,而車內場景更需要減少操作。
更合理的形態,是一個具備長期記憶、持續學習能力,並能主動提供服務的系統。它更聰明,也更接近「人」。
當座艙走到這一步,對車企的意義也會改變。從附加賣點,成為建立差異化的關鍵區域,甚至直接影響用戶的購車決策。
因此,一個像「豆包座艙助手」一樣,能夠理解用戶、持續提供幫助的系統,其價值不止於體驗提升,大概率會成為用戶購車的關鍵理由。