12月13日晚,豆包手機助手官方微信號發佈技術說明,回應網友關於其利用READ_FRAME_BUFFER等權限獲取銀行安全鍵盤等受保護內容的質疑。

豆包方面表示,該質疑是對技術實現的錯誤解讀。
豆包手機助手採用原生截屏接口(Window Manager Service.captureDisplay),嚴格遵循應用聲明的Secure標記,無法截屏銀行安全鍵盤等聲明受保護的界面內容。
關於權限使用,文中解釋稱:READ_FRAME_BUFFER權限是為了獲取虛擬屏中運行的應用截圖供模型推理,無法讀取Secure內容;CAPTURE_Secure_VIDEO_OUTPUT權限僅用於將受保護內容在投影中正常展示給用戶以便操作,受保護頁面仍無法被截屏。
此外,豆包披露了運行原理:用戶下達指令後,系統截屏上傳至雲端大模型分析(每步間隔約3秒),完成後執行操作。官方強調,截屏僅用於視覺理解和推理,任務完成後不會在雲端存儲。受限於芯片性能,目前國內多家手機廠商的AI助手產品均採用類似的雲端處理原理及系統權限。
這種「截圖上雲」的模式,其實解答了外界對於AI如何「看懂」手機的疑惑。簡單來說,就是把手機屏幕畫面像發圖片一樣,每隔幾秒傳給雲端的超級大腦,讓大腦看懂後再指揮手機怎麼點。
豆包在說明中坦言,受限於現在的手機芯片性能,還沒法直接在手機本地跑通這麼複雜的流程,所以這種由「遠程大腦」代駕的模式,不僅是他們一家在用,也是目前行業里的通用做法。
至於外界最擔心的「銀行密碼會不會被AI偷看」,這裡涉及安卓系統底層的「紅線」——Secure(安全)協議。雖然豆包為了實現自動操作,確實申請了較高的系統權限,但這並不意味着它能突破系統的底層防護。按照安卓的規則,只要銀行或支付App開啟了防截屏保護,AI截取到的畫面就是一片漆黑,根本看不見鍵盤和密碼。那些被質疑的特殊權限,實際上是為了讓用戶自己能看到畫面並進行操作,而不是給AI開後門。

記者:杜林 編輯:俞丹 校對:王菲