翻譯:白池磊 知產(chǎn)財經(jīng)
知產(chǎn)財經(jīng)從美國版權(quán)局官網(wǎng)獲悉,2025年5月9日,美國版權(quán)局發(fā)布《版權(quán)與人工智能》報告的第三部分(預(yù)發(fā)布版本):生成式人工智能訓(xùn)練。該報告圍繞AI訓(xùn)練的初步侵權(quán)認(rèn)定、合理使用分析、許可框架的選擇等問題展開,為立法、司法與業(yè)界提供了可參考的分析框架。以下是對報告核心內(nèi)容的概述。
一、生成式人工智能訓(xùn)練中的版權(quán)侵權(quán)認(rèn)定
?。ㄒ唬┏醪角謾?quán)認(rèn)定要素
構(gòu)成初步侵權(quán)需滿足兩個要素:1.有效的版權(quán)所有權(quán);2.復(fù)制受保護(hù)作品的原創(chuàng)性內(nèi)容(無論是否完全一致,只要存在實質(zhì)性相似即可)。
?。ǘ┥墒紸I開發(fā)中的潛在侵權(quán)環(huán)節(jié)
1.數(shù)據(jù)收集與整理
復(fù)制權(quán)問題:下載、存儲、格式轉(zhuǎn)換、篩選或修改受版權(quán)保護(hù)內(nèi)容的行為均可能侵犯復(fù)制權(quán)。即使數(shù)據(jù)后續(xù)被刪除,復(fù)制行為本身已構(gòu)成侵權(quán)。
衍生作品權(quán)問題:若整理過程中對作品進(jìn)行改寫、重組或生成合成數(shù)據(jù)(如為圖像添加文本描述),可能涉及衍生作品權(quán)。
2.模型訓(xùn)練
訓(xùn)練前的數(shù)據(jù)復(fù)制:訓(xùn)練需將數(shù)據(jù)集復(fù)制到高性能存儲設(shè)備,構(gòu)成復(fù)制權(quán)侵權(quán)。
訓(xùn)練過程中的臨時復(fù)制:數(shù)據(jù)分批次輸入模型時,臨時存儲的副本可能構(gòu)成侵權(quán)。
模型權(quán)重的爭議:若模型權(quán)重(參數(shù))編碼了受保護(hù)內(nèi)容的實質(zhì)性表達(dá)(如能生成與原作幾乎相同的輸出),則可能侵犯復(fù)制權(quán)或衍生作品權(quán)。法院判例存在分歧——部分案例認(rèn)為模型權(quán)重僅為抽象表達(dá)不侵權(quán)(如Kadrey v. Meta),但若模型能輸出實質(zhì)性相似內(nèi)容,則可能侵權(quán)(如Andersen v. Stability AI)。
3.RAG(檢索增強(qiáng)生成)
數(shù)據(jù)庫構(gòu)建:將受保護(hù)內(nèi)容復(fù)制到檢索數(shù)據(jù)庫中,構(gòu)成復(fù)制權(quán)侵權(quán)。
實時檢索:從外部來源(如搜索引擎)獲取內(nèi)容并生成回答時,臨時復(fù)制行為可能侵權(quán),尤其是當(dāng)系統(tǒng)保留檢索記錄或顯示原文時。
4. 輸出結(jié)果
直接復(fù)制:生成與原作幾乎相同的圖像、文本或角色(如電影劇照、新聞原文),可能侵犯復(fù)制權(quán)。
衍生內(nèi)容:改編或重構(gòu)原作的輸出(如修改故事情節(jié)或視覺風(fēng)格),可能侵犯衍生作品權(quán)。
(三)法律爭議焦點
1.模型權(quán)重的性質(zhì):需判斷其是否實質(zhì)保留或“記憶”了受保護(hù)內(nèi)容。
2.實質(zhì)性相似標(biāo)準(zhǔn):法院關(guān)注模型輸出是否與原作存在實質(zhì)性相似,而非僅技術(shù)實現(xiàn)方式。
3.責(zé)任分配:訓(xùn)練者、模型分發(fā)者及用戶的責(zé)任邊界尚不明確,需結(jié)合具體場景分析。
?。ㄋ模┬袠I(yè)與司法實踐
1.開發(fā)者風(fēng)險:主流開發(fā)者通常保留訓(xùn)練數(shù)據(jù)集以供未來使用,加劇侵權(quán)風(fēng)險。
2.新聞媒體關(guān)切:RAG技術(shù)對新聞內(nèi)容的檢索與生成引發(fā)強(qiáng)烈擔(dān)憂,可能替代原作并分流流量。
3.判例分歧:法院對技術(shù)細(xì)節(jié)的審查程度不同,導(dǎo)致同類案件結(jié)果差異。
二、未經(jīng)授權(quán)使用受保護(hù)的作品進(jìn)行AI模型訓(xùn)練的合理使用分析
(一)合理使用的四要素框架
1.用途與性質(zhì):重點考察使用是否具有“轉(zhuǎn)化性”(transformative),以及是否為商業(yè)性質(zhì)。模型的預(yù)訓(xùn)練(pre-training)通常具有高度轉(zhuǎn)化性,因為其目的是生成新場景下的多樣化輸出;而將模型用于生成與訓(xùn)練集作品實質(zhì)相似內(nèi)容,則轉(zhuǎn)化性較弱。同時,即便為非營利研究目的,若后續(xù)商業(yè)化部署,仍可能被認(rèn)定為商業(yè)使用。
2.作品性質(zhì):創(chuàng)作性強(qiáng)、尚未公開的作品更受保護(hù);科研或功能性作品則保護(hù)力度相對較弱。
3.使用數(shù)量與重要性:AI訓(xùn)練常需全量拷貝整個作品,這在傳統(tǒng)意義上不利于合理使用;但若此行為對達(dá)成轉(zhuǎn)化性目的“合理必要”,則第三因素的反對力度可減輕。
4.對潛在市場或價值的影響:若AI輸出可取代原作品,或稀釋同類型作品市場,市場傷害顯著;反之若有有效授權(quán)市場,未經(jīng)授權(quán)使用更難被認(rèn)定為合理使用。
?。ǘ┕怖婵剂?br>
盡管生成式AI帶來醫(yī)療、教育、內(nèi)容創(chuàng)作等廣泛社會效益,多方也擔(dān)憂對創(chuàng)作者生計的侵蝕。版權(quán)局認(rèn)為,除上述四要素已納入的公共利益考量外,額外將社會效益作為獨(dú)立權(quán)衡點的必要性不足。
?。ㄈ┰S可市場的可行性
報告指出,音樂、新聞、圖像等領(lǐng)域已有或正在建立針對AI訓(xùn)練的數(shù)據(jù)許可市場;若許可渠道可行,第四要素將更傾向于不支持未經(jīng)授權(quán)的訓(xùn)練。
?。ㄋ模﹪H比較
1.歐盟:通過DSM指令(Directive 2019/790)為科研目的文本挖掘(TDM)設(shè)立例外,并在《歐盟AI法案》中要求AI提供者遵守版權(quán)持有者的“選擇退出”(opt-out)機(jī)制。
2.英國:僅允許“非商業(yè)科研”場景下的計算分析,需合法獲取作品;版權(quán)持有者可明確排除。
3.日本、新加坡:分別對“享用”(enjoyment)及“合法訪問”作出限制性規(guī)定,排除涉及滿足個人觀賞或未經(jīng)合法途徑獲取的訓(xùn)練行為。
4.以色列:仿效美國合理使用,2022年司法部意見認(rèn)為大多數(shù)ML(機(jī)器學(xué)習(xí))訓(xùn)練為合理使用,但不涵蓋下游產(chǎn)品。
5.中國:尚無明確TDM或AI訓(xùn)練例外,實踐待發(fā)展。
三、AI 訓(xùn)練的許可框架
(一)自愿許可(Voluntary Licensing)
1.直接許可:AI 公司與單個版權(quán)主體一對一協(xié)商授權(quán)條款,根據(jù)作品類型和用途制定靈活的價格和范圍。
2.集體自愿許可:通過“集體管理組織”(CMOs)進(jìn)行大規(guī)模授權(quán),能夠簡化數(shù)以萬計的交易,降低雙方成本。
該許可模式可能存在的問題:
1.可行性:技術(shù)界擔(dān)憂面對海量、多樣作品時逐一許可成本過高;創(chuàng)作者界則認(rèn)為這只是商業(yè)成本,已有多起授權(quán)案例可資借鑒。
2.補(bǔ)償水平:許可費(fèi)用雖可能分散,但可采用基于收益或利潤的后付模式,避免前期高額支出;研究機(jī)構(gòu)或可依賴合理使用豁免。
3.反壟斷顧慮:集體授權(quán)需防范 CMOs 濫用定價權(quán),對此可通過保留“直接許可”選項及尋求司法部反壟斷指引來平衡。
(二)法定許可(Statutory Licensing)
1.強(qiáng)制許可(Compulsory License):由國會設(shè)定固定費(fèi)率和適用范圍,免除談判;歷史上僅在市場失靈嚴(yán)重時采用,但往往程序冗長、嵌入行業(yè)后難以廢除,且可能扼殺靈活創(chuàng)新。
2.擴(kuò)展集體許可(Extended Collective Licensing, ECL):借鑒歐洲模式,由政府授權(quán) CMOs 對某類作品統(tǒng)一授予許可,未加入的權(quán)利人可“選擇退出”;可在特定領(lǐng)域(如視覺藝術(shù))試點,但需做精細(xì)化設(shè)計,避免“一刀切”。
3.“選擇退出”機(jī)制:類似歐盟文本與數(shù)據(jù)挖掘例外,作品默認(rèn)可被 AI 爬取,但權(quán)利人可通過元數(shù)據(jù)、robots.txt 等途徑聲明不參與。實踐中存在元數(shù)據(jù)易篡改、平臺無權(quán)更改標(biāo)記等障礙,多數(shù)版權(quán)方并不支持由法律強(qiáng)制設(shè)立此機(jī)制。
?。ㄈ┌鏅?quán)局的分析與建議
1.因地制宜地推廣自愿許可:對于高價值、集中度高的作品(如熱門音樂、正版圖庫),自愿直接或集體許可已顯可行;對于分散、難以追權(quán)的內(nèi)容(如網(wǎng)絡(luò)評論、次生創(chuàng)作),可借助 CMOs 聚合權(quán)利、降低談判成本。
2.多樣化補(bǔ)償結(jié)構(gòu):除固定費(fèi)率外,應(yīng)鼓勵采用后付分成、基于收入/利潤比例的模式,支持小型初創(chuàng)與學(xué)術(shù)研究公允使用的需求。
3.謹(jǐn)慎對待法定強(qiáng)制:反對普遍的強(qiáng)制許可,其風(fēng)險在于“一成不變”、程序繁復(fù)且可能抑制創(chuàng)新;考慮有限度的ECL,僅在特定行業(yè)、特定作品類型中適用,并保留權(quán)利人退出權(quán);同時建議司法部就集體許可的反壟斷安全港提供指導(dǎo)。
4.暫不推行法律層面的“選擇退出”:技術(shù)實現(xiàn)和執(zhí)行成本較高,且難以消除既有模型已攝取的作品影響。
本報告最終版本將在不久后發(fā)布,預(yù)計內(nèi)容不會有實質(zhì)性變動。
?。ū疚闹黧w部分由AI總結(jié)生成,可能存在一定偏差或錯誤,敬請諒解。AI生成文字不代表本公眾號的觀點,僅作為輔助創(chuàng)作的參考)
附報告:
掃碼查看報告