“郭德綱秀英語”視頻如何鑒偽?京企新產品用AI打敗AI

最近,在互聯網視頻平台上,相聲演員郭德綱說起了流利的英語,這段能以假亂真的視頻,其實是通過人工智能(AI)技術生成的。與此同時,“AI換臉”等新型詐騙形式也開始出現,引發了公眾的擔憂。北京科技企業瑞萊智慧最新發布的生成式人工智能內容檢測平台DeepReal2.0,可以輕鬆識別人工智能生成的圖像、音視頻及大語言模型生成的文本等,讓其無處遁形。

利用人工智能技術生成的“郭德綱”能用英語說相聲,神態、動作、口型都宛如本人,而視頻右上角的一行小字“本視頻由AI生成”,引得不少網友發出感嘆,“人工智能技術太可怕了,不單聲音很純正,就連嘴型都無可挑剔”,“太自然了,差點兒以為是真的”。

這類視頻的底層技術屬於深度合成的技術分支——口型驅動,也就是對人臉信息進行局部篡改,當人工智能模型的訓練數據量足夠多、方法不斷優化,生成的視頻用人眼已經難辨真偽。對此,有網友表達了自己的擔憂:“能讓郭德綱講英語,還有什麼視頻做不出來?”

“魔高一尺,道高一丈”,人工智能技術偽造的視頻,也可以通過人工智能技術加以鑒別。“我們建設的生成式人工智能內容檢測平台,就是要‘用AI打敗AI’。”瑞萊智慧高級產品經理張天奕介紹,常見的“換臉式”生成視頻,一定會存在與真實拍攝不符的痕迹,或出現與常識不符的動作、行為等。檢測平台同樣藉助人工智能技術,在不斷學習各類可疑視頻的過程中,逐漸掌握識別的竅門,哪怕是細微的像素級篡改痕迹,也逃不過平台的“眼睛”。

瑞萊智慧在2023年世界互聯網大會上發布生成式人工智能內容檢測平台DeepReal2.0

利用學術數據集與主流網絡數據集進行測試,該平台的檢測準確率已達到99%以上。它的“實戰”成績也相當突出,對圖像、視頻、音頻等生成式人工智能內容檢測準確率,已達到國內外業界的頂尖水平。同時,平台還在探索對大語言模型生成文本的識別,不斷提升檢測的準確率。

目前,該平台主要服務於政府監管及商業平台需求,尚未對公眾開放。前不久出台的《互聯網信息服務深度合成管理規定》,明確要求深度合成服務提供者對使用其服務生成或者編輯的信息內容,應當採取技術措施添加不影響用戶使用的標識。張天奕表示,公司也在協助相關部門探索更優的標註和識別方式,保障相關技術在法律框架內的有序發展。

隨着人工智能技術的發展,平台也將持續跟進並研究新的偽造檢測技術,明確真偽的邊界。“偽造技術和破解技術的攻防交替升級,是必然的過程。”作為人工智能行業從業者,張天奕認為,人工智能兼具建設性和破壞性的“雙刃劍”效應,高水平的安全,是人工智能高質量發展的前提,最終需要從模型算法的原理上加以突破。

【相關鏈接】

遇到疑似“AI換臉”詐騙怎麼辦?

問:一通視頻電話打來,對面的“親朋”卻可能是人工智能生成的圖像,如何才能準確識別“AI換臉”詐騙?

張天奕:用生成式人工智能模仿受害人身邊的親友,詐騙者能獲取的樣本數量是有限的,可以通過延長通話時間、多次提問等方式讓視頻中的“人”多說話,對方便更容易露出破綻。如果詐騙者的技術水平較弱,引導對方做大幅度搖頭、張嘴等動作,就能暴露出面部邊緣、牙齒等部位的瑕疵;在聲音偽造方面,可以嘗試用方言交流。不過,這些技巧對於識別“高水平”的不法分子依然存在難度,建議可以輔以詢問親友間小範圍知悉的信息,進行身份核實。

問:怎樣才能防止個人信息被不法分子利用?

張天奕:生成式人工智能的“原料”就是個人的音頻、視頻、圖像。大家一定要注意保護自己的面部圖像、聲音等個人信息,特別是高清的照片、視頻,建議不要在公開平台發布,降低被盜用的可能。

來源:北京日報客戶端 記者:劉蘇雅