AI大模型、空間計算已「上車」,商湯絕影全球首創座艙3D視線交互即將亮相

AI大模型、空間計算等前沿技術在汽車上的應用落地來得比預想更快。去年,Apple Vision Pro的橫空出世讓人們領略到了3D交互的魅力,在即將到來的2024北京國際汽車展覽會,上海人工智慧企業商湯科技將帶來兩大全新座艙3D交互演示:3D Gaze高精視線交互和3D動態手勢交互。

同時,作為行業首個提出感知決策一體化自動駕駛通用模型的公司,商湯還將帶來面向量產的真·端到端自動駕駛解決方案的上車演示首秀,還會展示以多模態場景大腦為核心的AI大模型座艙產品矩陣。

Vision Pro「裸眼上車」

3D 動態手勢交互是行業領先的支持動態手勢和手部微動作識別的智能座艙技術,能讓用戶通過手勢「隔空」進行各類座艙交互。作為全球首創的能夠通過視線定位與屏幕圖標進行交互的智能座艙技術,商湯絕影的3D Gaze高精視線交互將讓用戶通過眼神控制中控圖標。商湯絕影這兩大艙內3D交互功能相互配合,如同「Vision Pro」裸眼上車,為用戶打造更符合人類直覺的自然交互體驗。

在智能座艙方面,商湯絕影已打造出「多模態場景大腦」為核心的AI大模型座艙產品矩陣,通過多模態大模型、大語言模型、文生圖模型等能力組合,為智能座艙注入強大的環境理解、邏輯思維和內容生成能力。

商湯絕影上車的AI大模型將能夠基於地理位置推薦符合用戶喜好的餐廳、介紹用戶感興趣的外部自然景物,並進行優質景點推薦。不僅如此,基於強大的多模態感知能力,搭載商湯絕影方案的車輛可以準確感知並識別車外的信息,包括周圍車輛的車型、標誌性建築物等,以語音、圖片或者視頻等方式為艙內人員提供更為準確和全面的內容,幫助用戶了解和掌握外部環境信息。

「最佳論文」解決方案將迎來首秀

2022年底,商湯及其聯合實驗室提出了行業首個感知決策一體化自動駕駛通用模型UniAD,並於次年榮獲2023年國際計算機視覺與模式識別會議(CVPR)最佳論文。

在本屆北京車展上,商湯絕影也將帶來面向量產的感知決策一體化的真·端到端自動駕駛解決方案——UniAD,並首次面向公眾展示UniAD的實車道路演示成果。

隨著自動駕駛技術的不斷演進,基於規則的智駕方案需要多感測器融合感知且大量投入資源來應對無保護左轉、人車混行等複雜路況。而商湯絕影UniAD方案僅憑攝像頭的視覺感知,無需高精地圖,通過數據學習和驅動就能夠應對城區的複雜環境。不僅如此,在傳統方案較難突破的無中線的鄉村道路上,UniAD同樣可以自如行駛,完成包括大角度左轉上橋、避讓佔道車輛及施工區域、繞行跑步行人等一系列高難度操作,真正做到「像人一樣開車」。

為了增強端到端自動駕駛方案可解釋性和交互能力,依託多模態大模型,商湯絕影已研發出新一代自動駕駛大模型DriveAGI,適用場景更寬、性能更高、門檻更低,體驗上做到可感知、可交互、可信賴。作為下一代自動駕駛技術,DriveAGI也將在車展期間進行前瞻預覽。