蘋果聯合哥倫比亞大學開發AI系統SceneScout,為盲人解鎖街景導航

it之家 7 月 8 日消息,蘋果與哥倫比亞大學的研究團隊開發出了一項名為 scenescout 的 ai 原型系統,旨在為盲人及低視力群體(blv)提供街景導航輔助。

該系統結合蘋果地圖(apple maps)api 與多模態大語言模型(基於 gpt-4o 內核),生成定製化環境描述。it之家注意到,相關論文已經發表在預印平台 arxiv 上(未經同行評審)。

核心功能:

  • 路線預覽(route preview):
    • 預判行程中的道路狀況:人行道質量、交叉口、公交站特徵等
  • 虛擬探索(virtual exploration):
    • 開放場景響應:根據用戶需求(如「臨近公園的安靜居住區」)提供方向指引

該系統可通過模擬行人的視角,解讀可見內容,並輸出結構化文本(短 / 中 / 長),適配讀屏軟體。

據介紹,scenescout 在測試階段招募了 10 名視障用戶(多具備科技行業背景),結果顯示:

    • 72% 的 ai 生成描述準確
    • 虛擬探索模式獲高度評價(用戶稱其可替代傳統信息獲取方式)