購買圖書訓練AI不構成侵權!美國AI明星公司贏下重大法律勝利 仍需為下載盜版書支付沉重代價

財聯社6月25日訊(編輯 史正丞)根據美國加州北區法院發布的判決書,美國人工智慧初創企業Anthropic贏下首個有利於AI產業的開創性判決:法官William Alsup裁定公司對合法購買的書籍進行數字化,並用於AI模型的訓練屬於合理使用範疇。

但法官也表示,明明有合法購買途徑,公司卻通過互聯網下載「數百萬本」盜版書,這一過失仍需單獨追究法律責任。

作為本案的背景,作家安德烈婭·巴茨、查爾斯·格雷伯和柯克·華萊士·約翰遜去年將Anthropic告上法庭,指控公司使用盜版材料訓練「克勞德」(Claude)系列AI模型。作為一系列AI時代奠定規則的訴訟之一,本判決可能成為未來美國法官處理AI版權糾紛的裁量參考。

(來源:美國加州北區法院)

值得一提的是,本案法官正是當年甲骨文訴谷歌Java侵權案的一審法官。那起動員整個美國科技圈的官司最終由美國高院落錘裁定,谷歌對Java API的使用屬於「合理使用」範疇。

買書用於訓練AI合法,但「偷書」不行

作為關鍵爭議點之一,Alsup裁定,Anthropic購買實體書籍、裁切頁面、掃描並用於訓練AI模型的行為合法

法官表示,在版權法中,法院判定未經許可使用版權作品是否構成合理使用的主要標準之一,是審查該使用是否具有「轉化性」——即並非替代原作,而是創造出新內容。因此,Anthropic對合法購買的實體書進行數字化屬於合理使用範疇,而利用這些數字副本訓練大語言模型具有足夠的轉化性,同樣構成合理使用。

Alsup在裁決書中寫道:「原告的控訴無異於抱怨學校培養孩子寫作會導致競爭作品激增…《版權法》旨在推動原創作品發展,而非保護作者免受競爭。」

(來源:判決書)

法官也表示,Anthropic將數百萬本盜版書籍存儲在訓練模型的「中央圖書館」中,公司需要為這種行為接受懲罰。他在判決書強調:「本庭質疑任何被控侵權方如何能證明:從盜版網站下載本可以通過合法途徑購買的書籍,對其後續構成合理使用確屬合理必要。」

庭審文件顯示,Anthropic最早自2021年起就從一系列盜版網站下載了超過700萬本書

判決書裁定,法院後續將對Anthropic使用盜版內圖書的問題進行單獨審理,並決定最終的賠償金額。

據悉,在美國此類版權侵權官司的最低法定賠償標準是每本書750美元,所以Anthropic後續仍有可能面臨超過50億美元的罰金。順便一提,美國版權法對單部作品侵權賠償上限為3萬美元,若構成惡意侵權,罰金最高可達到15萬美元/部作品

在今年3月完成最新一輪融資時,Anthropic的估值為615億美元。

值得注意的是,本案並不涉及AI模型輸出的內容是否侵犯版權,這恰恰是諸多其他案件的爭議焦點。

(財聯社 史正丞)