it之家 7 月 8 日消息,蘋果與哥倫比亞大學的研究團隊開發出了一項名為 scenescout 的 ai 原型系統,旨在為盲人及低視力群體(blv)提供街景導航輔助。
該系統結合蘋果地圖(apple maps)api 與多模態大語言模型(基於 gpt-4o 內核),生成定製化環境描述。it之家注意到,相關論文已經發表在預印平台 arxiv 上(未經同行評審)。
核心功能:
- 路線預覽(route preview):
- 預判行程中的道路狀況:人行道質量、交叉口、公交站特徵等
- 虛擬探索(virtual exploration):
- 開放場景響應:根據用戶需求(如「臨近公園的安靜居住區」)提供方向指引
該系統可通過模擬行人的視角,解讀可見內容,並輸出結構化文本(短 / 中 / 長),適配讀屏軟體。
據介紹,scenescout 在測試階段招募了 10 名視障用戶(多具備科技行業背景),結果顯示:
- 72% 的 ai 生成描述準確
- 虛擬探索模式獲高度評價(用戶稱其可替代傳統信息獲取方式)
科技分類資訊推薦
科技分類視頻推薦