​ElevenLabs AI創始人提出應對音頻Deepfakes想法:加水印

劃重點:

⭐ ai 語音技公司面臨應對 deepfakes 的挑戰

⭐ elevenlabs ceo 提出數字水印技術應對 deepfakes

⭐ 技術應前景廣闊,但也存在濫用風險和合規難題

站長之家(chinaz.com)5月6日 消息:ai 語音技術領域的公司正努力尋求何規範 deepfakes,同時又不抑制創新。elevenlabs 的聯合創始人兼 ceo mati staniszewski 告訴《大西洋月刊》說:“這將是一場貓鼠遊戲”。去年在測試版推出後,elevenlabs 一躍成為價值億美元的公司,其使用 ai 生成逼真的音頻剪輯。這包括文本轉語音配音、在29種語中配音以及克隆聲音。該公司聲稱,其用戶在過去一年內生成了超過100年的音頻內容。

圖源備註:圖片由ai生成,圖片授權服務商midjourney

立法者擔心這項技術存在危險的濫用潛力。人工智能的進步與電話詐騙的增加關,詐騙者會冒充愛人、家庭成員或政府官員進行超級電話詐騙。拜登的人工智能主管布魯斯・里德甚至表示,“聲音克隆” 是一讓他夜不能寐的事情。去年,4chan 用戶利用 elevenlabs 的工具生成了名人深度偽造,視頻中的內容充斥着種族主義和跨性別歧視,據《副刊》報道。

但 staniszewski 是一個理想義者。他認為 elevenlabs 的技術可以促進一個世界,在那裡患有像肌萎縮側索硬化症 als)這樣的神經退行性疾病的患者失去說話能力後仍然可以用他們自己的聲音交流。這項技術還有助於幫助人們跨越文化和語言進行溝通。紐約市市長埃里克・亞當斯用 elevenlabs 的技術用普通話、意第緒語和海地克里奧爾語撥打電話,稱他已經能夠到更多的非英語母語的市民。

為了充分發揮這一潛力並防止欺詐,staniszweski 表示,用戶應該能夠識別人工智能生成的聲音和人類的聲音。staniszewski 告訴《大西洋刊》,“真正的解決方案” 是對合成聲音進行數字水印處理,以便人類能夠區分真假。該公司正在開發這項技術,但只有在其他公司的合作下才能發揮作用。elevenlabs 已與包括 ai、anthropic、google 和 meta 在內的幾家人工智能公司簽署了一項協議,共同打擊2024年選舉中的 deepfakes。