英國議會正在審議《數據使用與訪問法案》(data (use and access) bill),該法案旨在規範用戶與客戶數據的使用權限。這項立法可能對it產業產生深遠影響,尤其是對那些依賴海量人類生成數據訓練其聊天機械人系統的 ai 公司而言更是如此。
英國前副首相、前meta高管尼克·克萊格(nick clegg)在一次新書《如何拯救互聯網》(how to save the internet)的推廣活動中表示,人工智能公司在使用受版權保護的數據時,不應每次都需要徵求許可。
克萊格警告稱,如果強制科技公司遵守版權法,並在使用受保護內容訓練 ai 模型時通知權利人,英國的 ai 行業將會「一夜之間垮掉」。他辯稱,這些內容已經是公開可獲取的,而 ai 系統需要龐大的數據量來提升其推理能力。
克萊格指出,現有的版權法與 ai 技術本身存在根本性不兼容,如果每次訓練模型都必須獲得授權,整套 ai 技術就無法運行。他表示,藝術家和版權持有者應有明確且簡便的方式選擇不參與數據抓取,但一一尋求許可並不可行。
「我認為人們應該擁有一種清晰、便捷的方式,說『不,我不願意,我要退出』,」這位前meta副總裁表示,「但我認為如果期待這個行業在訓練開始前就逐一徵求許可,不論在技術上還是其他方面,都是行不通的。很抱歉,這與技術本身的物理規律相衝突。」
隨着英國議會圍繞該法案展開辯論,克萊格將重點放在英國的 ai 產業上。由電影導演比班·基德倫(beeban kidron)牽頭的一群藝術家和作家組成的聯盟推動修改該法律,要求 ai 公司必須公開其用於模型訓練的數據來源。但該提議遭到了議會否決。
基德倫在《衛報》發表的評論文章中指責政府實質上是在批准「大規模文化盜竊」的計劃。她表示,在缺乏透明度的情況下,英國當局實際上是在允許 ai 公司隨意使用受版權保護的作品,而公眾幾乎沒有選擇「退出」的可能。
她補充說,政府確實可以通過議會多數強行推動該法案的通過,但這種做法將對英國的創意產業造成災難性打擊。不過,這場戰鬥尚未結束 —— 該法案草案將於 6 月 2 日在上議院再次接受投票審議。