作者:
張? ?鵬? 北京市中倫律師事務所高級顧問
牟雨菲??北京市中倫律師事務所律師
引言:隨著生成式人工智能等顛覆性 AI 技術的突飛猛進,人類社會的生產(chǎn)、生活方式乃至社會治理模式都將隨之迎來新的變革。在這一時代背景下,如何認識人工智能產(chǎn)業(yè)發(fā)展帶來的各種法律問題,也越來越具有現(xiàn)實意義?;诖耍?月13日,由中國人民大學知識產(chǎn)權學院主辦、知產(chǎn)財經(jīng)協(xié)辦的“人工智能相關法律適用問題”研討會在北京舉辦,會議邀請了行業(yè)多領域代表,共同探討和研究實務中遇到的涉人工智能法律問題及解決之道,以期為人工智能相關環(huán)節(jié)的法律適用問題探究答案。會上,北京市中倫律師事務所高級顧問張鵬律師圍繞“歐盟《人工智能法》基于風險的立法特點對我國的啟示”話題進行主題演講,知產(chǎn)財經(jīng)8月8日刊發(fā)。在討論過程中,與會專家圍繞對我國著作權制度的啟示進行了深入討論,本文作者受相關討論內容的啟發(fā),結合美國人工智能相關立法新動向,形成本文,期待業(yè)界的深入討論。
歐洲當?shù)貢r間2024年7月12日,《歐盟官方公報》正式發(fā)布了具有里程碑意義的《歐洲人工智能法》的最終文本。2024年8月2日,全球首個以立法模式對人工智能進行監(jiān)管的法規(guī)落地生效,標志著全球人工智能領域法律監(jiān)管將邁入全新時代。歐盟《人工智能法》在著作權方面明確了責任主體、確定了限制和例外、提出了域外適用,并規(guī)定了與信息提供和信息公開相關的證據(jù)規(guī)則[1],尤其是,歐盟《人工智能法》第五十三條規(guī)定了通用型人工智能模型的著作權合規(guī)義務以及治理措施。與此同期,當?shù)貢r間2024年7月11日,美國參議員、參議院商務委員會主席Maria Cantwell、商務委員會成員Marsha Blackburn和參議院人工智能工作組成員Martin Heinrich提出了一份《內容來源保護和防止編輯和深度偽造媒體完整性法案》(Content Origin Protection and Integrity from Edited and Deepfaked Media Act, COPIED ACT)(以下簡稱“《COPIED法案》”)[2],旨在為標識、驗證和監(jiān)測人工智能生成物制定聯(lián)邦層面的透明度準則,以保護記者、演員和藝術家免受人工智能的盜用行為,并追究違法者濫用職權的責任。本文將從人工智能著作權侵權規(guī)制制度的角度,比對歐盟及美國作為世界兩大主要法域對于人工智能著作權侵權問題的規(guī)制理念與監(jiān)管措施,并通過二者異同討論對我國的啟示。
一、歐盟《人工智能法》著作權規(guī)則要點探析
歐盟《人工智能法》第五十三條規(guī)定了通用人工智能模型(general-purpose AI model,以下簡稱“GPAIM”)提供者的著作權合規(guī)義務,特別是訓練模型主要訓練數(shù)據(jù)集合的披露義務及遵守歐盟著作權相關法律的義務。其中,GPAIM是指,無論以何種方式投放市場,在使用大量數(shù)據(jù)進行大規(guī)模自我監(jiān)督訓練時均具有顯著的通用性,能夠勝任各類不同任務并可集成到各種下游系統(tǒng)或應用中的人工智能模型。無論GPAIM最終被嵌套進何種人工智能系統(tǒng)或應用中,一旦該模型將最終用于商用目的,相關提供者就需要遵守《人工智能法》第五十三條規(guī)定的著作權合規(guī)義務,具體包括公開披露義務、遵守歐盟著作權法的義務、技術文件留檔義務和信息共享義務。技術文件留檔義務和信息共享義務比較明確,尤其需要關注的是訓練模型主要訓練數(shù)據(jù)集合的披露義務及遵守歐盟著作權相關法律的義務。其中,GPAIM訓練模型主要訓練數(shù)據(jù)集合的披露義務所涉及的相關披露文件一般包括,“用于訓練模型的主要數(shù)據(jù)集合或集合,例如大型私人或公共數(shù)據(jù)庫或數(shù)據(jù)檔案,并提供有關所使用的其他數(shù)據(jù)源的敘述性解釋”[3]。關于該披露義務的具體內容,《人工智能法》第五十三條第一款第(a)和(d)項主要要求GPAIM提供者編制并不斷更新該模型的技術文件,包括其訓練和測試過程及其評估結果,其中至少應包含該法附件11所列的要素,以便應要求向人工智能辦公室和國家主管機關提供;根據(jù)由人工智能辦公室提供的模板,起草并公開有關用于通用人工智能模型訓練內容的足夠詳細的摘要。下面重點分析遵守歐盟著作權相關法律的義務。
第一,遵守歐盟著作權相關法律義務的適用范圍。GPAIM的提供者應在開發(fā)至投入市場過程中全程遵守歐盟相關著作權法,且該義務僅與該模型是否能夠在歐盟境內獲取使用有關,無論相關訓練或開發(fā)行為發(fā)生地是否位于歐盟境內。具體而言,歐盟《人工智能法》前言第106條指明,“任何將GPAIM投放到歐盟市場的提供者都應遵守歐盟版權相關權利的法律……無論這些GPAIM的訓練所依據(jù)的版權相關行為發(fā)生在哪個司法管轄區(qū)。”歐盟《人工智能法》第五十三條第一款第(c)項要求,GPAIM提供者制定一項尊重歐盟著作權法的政策,特別是通過先進水平技術等手段,確定和尊重權利人根據(jù)2019/790號單一數(shù)字市場版權指令第4條第3款表達的權利保留?!?/p>
第二,歐盟《人工智能法》關于遵守歐盟著作權相關法律義務引用《2019/790號單一數(shù)字市場版權指令》的規(guī)定,提出GPAIM訓練過程中的文本與數(shù)據(jù)挖掘行為不構成著作權侵權(除非權利人作出了保留)。特別值得注意的是,歐盟《人工智能法》第五十三條第一款第(c)項規(guī)定GPAIM提供者應遵守《2019/790號單一數(shù)字市場版權指令》(CDSMD),尤其是CDSMD第四條第三款的權利保留。具體而言,《2019/790號單一數(shù)字市場版權指令》第四條第一款規(guī)定,“成員國應規(guī)定作者(包括計算機程序和數(shù)據(jù)庫作品的作者)、數(shù)據(jù)庫制作者和新聞出版商‘為文本和數(shù)據(jù)挖掘目的(text and data mining, TDM)復制和使用合法獲取的作品和其他客體著作權的例外或限制’”;第四條第三款規(guī)定,“上述例外或限制僅在以下條件下適用:作品和其他客體權利人未以適當?shù)姆绞矫鞔_保留,例如在在線公開提供的內容中采用機器可讀的方式保留其權利,禁止任何TDM的使用?!?/p>
結合《人工智能法》以及《2019/790號單一數(shù)字市場版權指令》的相關規(guī)定,GPAIM訓練過程中的文本與數(shù)據(jù)挖掘行為不構成著作權侵權,除非被復制內容的權利人明確以《2019/790號單一數(shù)字市場版權指令》第四條第三款規(guī)定的方式進行了權利保留?!?019/790號單一數(shù)字市場版權指令》第四條為文本與數(shù)據(jù)挖掘行為創(chuàng)設了著作權限制,如復制行為落入該法限定的“文本與數(shù)據(jù)挖掘”[4]的范疇,則不構成侵害被復制內容或作品的著作權。而《人工智能法》指明GPAIM將遵守《2019/790號單一數(shù)字市場版權指令》相關規(guī)定,由此確定AI模型訓練過程中的文本與數(shù)據(jù)挖掘行為適用《2019/790號單一數(shù)字市場版權指令》的著作權限制。同時,需要特別強調的是,《2019/790號單一數(shù)字市場版權指令》創(chuàng)設的著作權限制存在例外,如權利人以“適當?shù)姆绞健保ɡ鐧C器可讀的方式)明確聲明權利保留,則《2019/790號單一數(shù)字市場版權指令》第四條第一款不適用。
第三,歐盟《人工智能法》未明確規(guī)定人工智能著作權侵權行為的個人救濟途徑。歐盟《人工智能法》并未明確提及著作權權利人針對人工智能著作權侵權以及其他違反《2019/790號單一數(shù)字市場版權指令》行為的個人救濟途徑,而是僅指明各成員國人工智能主管機構負責監(jiān)管上述義務的履行,主要局限于針對透明度義務以及預防性政策制定的審查等。
二、美國《COPIED法案》著作權規(guī)則要點探析
美國積極推動人工智能相關立法。2021年1月1日,美國《國家人工智能倡議法(National Artificial Intelligence Initiative Act of 2020)》正式生效,設立商務部國家人工智能咨詢委員會促進人工智能研究和應用,包括設定人工智能使用的法律標準。2023年2月,美國國家版權局發(fā)表聲明表達其對人工智能生成物可版權性的觀點,如果人工智能技術確定作品輸出的表達要素時,生成的內容不是人類作者的產(chǎn)物,該內容不受版權法保護。2023年8月4日,美國國會研究部門發(fā)表《人工智能:概述、近期進展和對第118屆國會的展望》,該報告對美國針對人工智能的立法監(jiān)管政策進行了詳細歸納和匯總。特別是,目前也有集體訴訟或個人針對人工智能技術公司,如針對Meta、OpenAI、微軟公司等訓練數(shù)據(jù)行為違反版權法等法律規(guī)定提起訴訟。[5]尤其是,為制裁有害的深度偽造(Deepfake)行為,《COPIED法案》旨在為標識、驗證和監(jiān)測人工智能生成物制定聯(lián)邦層面的透明度準則,以保護記者、演員和藝術家免受人工智能(以下簡稱“AI”)的盜用行為,并追究違法者濫用職權的責任。針對這一立法主旨,該法案主要介紹了以下四大舉措[6]:
第一,制定透明度標準。要求美國國家標準與技術研究院(NIST)會同美國專利商標局(USPTO)以及美國版權局(U.S. Copyright Office)制定有關內容來源信息、水印和合成內容檢測的準則和標準的自愿性指南,以提高透明度,其中包含以相關制度確定內容是否由人工智能生成或操縱,以及人工智能內容的來源。該法案還指示NIST制定網(wǎng)絡安全措施,以防止篡改人工智能內容的來源和水印。
第二,增強記者、藝術家以及音樂創(chuàng)作者對創(chuàng)作內容的控制權。要求用于生成創(chuàng)意或新聞內容的人工智能工具提供者及部署者允許該內容的所有者在其上附加出處信息,并禁止將其刪除。如未經(jīng)授權,人工智能提供者不得將標有出處信息的內容用于訓練人工智能模型或生成人工智能內容。這些措施使內容所有者(記者、報紙、藝術家、詞曲作者和其他人)能夠保護他們的作品并為其內容設定使用條款,包括報酬。
第三,賦予個人起訴侵權者的權利。授權聯(lián)邦貿易委員會(FTC)和州總檢察長針對本法相關不公平和欺騙性行為的執(zhí)法權能,賦予包括報紙、廣播公司、藝術家和其他內容所有者對未經(jīng)許可使用其內容的平臺或其他人提起訴訟的權利。
第四,禁止篡改或刪除人工智能出處信息。目前,沒有法律禁止刪除、篡改內容出處信息或使之無效等行為。該法案將禁止任何人,包括互聯(lián)網(wǎng)平臺、搜索引擎和社交媒體公司,以任何方式使內容來源信息無效化。
該法案提出后,得到了美國演員工會、納什維爾歌曲作家協(xié)會、美國唱片業(yè)協(xié)會、美國新聞/媒體聯(lián)盟、美國報業(yè)、美國藝術家權益聯(lián)盟、美國歌曲作者協(xié)會等組織的大力支持。例如,美國國家音樂出版商協(xié)會表示,“《COPIED法案》確保AI生成的內容得到明確識別,并且在這些標簽被篡改時有追索權。隨著AI生成的音樂繼續(xù)擾亂合法市場,聽眾必須知道他們的音樂來自哪里。藝術家和詞曲作者應該得到保護,免受未經(jīng)授權的盜用,這項立法是實現(xiàn)這一目標的重要一步。”代表美國1500多家社區(qū)報紙的行業(yè)協(xié)會美國報紙協(xié)會表示,“新聞機構為其社區(qū)提供可信賴的信息和新聞,這對我們的民主至關重要。必須解決深度偽造問題,以維持消費者對新聞提供商的信心。我們期待與參議員就這項重要立法進行合作?!?[7]
三、美國《COPIED法案》與歐盟《人工智能法》人工智能著作權規(guī)則的異同
美國《COPIED法案》與歐盟《人工智能法》均立足于生成式人工智能發(fā)展所必需的數(shù)據(jù)資源支撐與著作權人合法權利保護兩個方面的平衡構建相關制度,但是二者的適用范圍、透明度義務、著作權侵權規(guī)則具有較大差異。美國《COPIED法案》與歐盟《人工智能法》均意識到,訓練數(shù)據(jù)的體量和質量是決定生成式人工智能運行能力和智能水平的基礎。此類生成式人工智能往往采用神經(jīng)網(wǎng)絡算法,并依靠大量的訓練數(shù)據(jù)來訓練算法模型,以達到迅速針對不同的用戶指令輸出高質量、高精度的輸出內容。基于這一特性,生成式人工智能的開發(fā)和運行幾乎完全依賴于對大批量且不特定內容或數(shù)據(jù)的復制、使用、修改以及二次編譯,當訓練數(shù)據(jù)中存在未經(jīng)授權抓取的著作權人專有作品時,即構成對訓練數(shù)據(jù)來源權利作品的侵權,應承擔侵權責任。當生成的作品與已有作品構成實質性相似,也可能涉及對訓練內容著作權保護客體的直接侵權責任[8]。但另一方面,人工智能機器學習過程中對于權利作品的使用與傳統(tǒng)著作權法規(guī)制的使用行為存在形式、目的以及可規(guī)制性上的差別。首先,在使用形式上,人工智能算法訓練過程中往往會通過數(shù)據(jù)爬蟲、API接口對接等自動化方式捕獲、存儲公開數(shù)據(jù),涉及數(shù)量龐大、種類繁多(除數(shù)據(jù)及文字作品外,還包括攝影作品、音樂作品、錄像制品等),且最終使用主體超出人工智能提供者的范圍,可能涉及人工智能部署者、使用者或最終用戶等[9]。
一方面,美國《COPIED法案》與歐盟《人工智能法》著作權規(guī)定的立法背景及立法目的相同。為平衡生成式人工智能發(fā)展所必需的數(shù)據(jù)資源支撐與著作權人合法權利保護這兩方面問題,全球主要法域均試圖以著作權限制規(guī)則來對著作權人享有的合法權益以及產(chǎn)業(yè)健康發(fā)展進行平衡調配。
美國《COPIED法案》的立法背景或為調配美國《版權法》下較為寬泛的合理使用制度的運用。根據(jù)美國《版權法》第107條,判斷爭議行為是否構成合理使用包含四個要素:(1)使用的目的和性質,包括是否出于商業(yè)目的或非營利的教育目的;(2)受到版權法保護的作品的性質;(3)被使用部分的數(shù)量和重要程度對于被使用作品的整體的情況;(4)這種使用對于被使用作品的潛在市場或者作品的價值的影響[10]。
在谷歌數(shù)字圖書館案[11]中,美國聯(lián)邦最高法院認為,谷歌對于原告圖書數(shù)字化復制有高度的轉換性目的,其對原作的復制目的是讓原著有關的重要信息可以被獲取,使得搜索者尋找到那些包含他們感興趣的關鍵詞的圖書,以及不包含關鍵詞的書,從而達到促進圖書銷量,沒有對圖書版權權利人造成明顯損害。因此,在考慮使用行為的轉換性的情況下,“谷歌的商業(yè)特性和逐利動機不能作為否定合理使用的正當理由”。除轉換性目的外,美國法院還將結合其他三項因素進行綜合考量。由此可見,在美國法下,即便服務提供者提供生成式人工智能服務為商業(yè)目的并帶有逐利動機,在綜合整體因素的情況下,仍然可以構成合理使用。
合理使用的擴張性理解能夠在近期美國唱片業(yè)協(xié)會(RIAA)訴Udio和Suno音樂生成初創(chuàng)公司一案中體現(xiàn)。8月1日,音樂人工智能公司Suno就前述案件發(fā)布博文,聲稱使用數(shù)千萬張唱片來訓練人工智能模型過程,其中確實有來自上述3家唱片公司的唱片內容,但根據(jù)美國版權法的合理使用原則,此類活動屬于合理使用范圍,這意味著不需要許可證,并指責唱片公司濫用版權[12]。該份聲明表達了生成式人工智能產(chǎn)業(yè)對于推動相關法律法規(guī)的明確和適應新技術發(fā)展調整的強烈意愿,但同時也遭到版權人的強烈反對。
在上述背景下,美國《COPIED法案》旨在通過創(chuàng)設生成式AI提供者的披露義務(禁止刪除標識出處)以及允許版權人進行權利保留(禁止未經(jīng)授權使用標有出處信息的內容)來為版權人提供對抗合法使用抗辯的額外保護。即使人工智能模型訓練可能被認定為對訓練數(shù)據(jù)的合理使用,依據(jù)美國《COPIED法案》,如相關版權人對內容進行了出處信息標識,則人工智能提供者仍需獲得版權人的許可。同時,這一舉措與歐盟《人工智能法》的相關規(guī)定相吻合。依照歐盟《人工智能法》第五十三條的規(guī)定,GPAIM數(shù)據(jù)訓練將適用CDSMD第四條第一款的著作權限制以及第四條第三款的著作權人權利保留的例外。這代表GPAIM提供者在訓練過程中的文本與數(shù)據(jù)挖掘行為一般不構成著作權侵權,但如相關版權人對權利內容明確聲明保留權利,則人工智能提供者仍需獲得版權人的許可。
另一方面,美國《COPIED法案》與歐盟《人工智能法》的著作權限制相關舉措存在差異。
第一,美國《COPIED法案》與歐盟《人工智能法》的適用范圍存在較大差異。從義務主體角度,歐盟《人工智能法》第五十三條相關著作權規(guī)范適用于所有通用型人工智能模型提供者,盡管歐盟《人工智能法》的大部分規(guī)定采用了風險分級管理模式以達到限縮影響范圍的作用,這一立法模式并不適用于第五十三條,而美國《COPIED法案》僅要求“用于生成創(chuàng)意或新聞內容的AI工具提供者及部署者”履行相關披露義務。而從權利客體角度,CDSMD作為歐盟法律體系中的“指令”(Directive),將由全體歐盟成員國進行本國法轉化后適用于全體歐盟公民。而《COPIED法案》在立法目的上僅列舉了記者、藝術家以及音樂創(chuàng)作者等類型的權利人作為重點保護對象[13],雖然現(xiàn)版本美國《COPIED法案》并未明確限定權利保護客體的種類范圍,但介于該法案處在初期形成階段,其適用范圍仍有待觀察。
第二,美國《COPIED法案》與歐盟《人工智能法》的權利救濟不同。美國《COPIED》法案第7條(c)款明確“任何標有出處信息內容的版權人,如果其內容來源信息與此法所述人工智能生成內容相關聯(lián),則可以在有管轄權的法院對(A)任何刪除、更改、移除其出處信息的個人或平臺,以及(B)任何擅自適用其權利內容的個人或平臺提起訴訟……訴訟時效為四年,自版權人知道或應當知道上述侵權事實之日起算?!?,而歐盟《人工智能法》針對第五十三條下的義務并未提及個人救濟權利或救濟方式,唯一關于維權救濟僅有該法第九章第4節(jié)提及“自然人或法人可以向AI主管機構提交訴請或投訴(Complaint)”。
第三,美國《COPIED法案》與歐盟《人工智能法》的執(zhí)行措施不同。歐盟《COPIED》法案第7節(jié)“執(zhí)行”中較為完善地規(guī)定了該法的授權機關、執(zhí)行權限和執(zhí)行措施,其中規(guī)定,“違反本法或根據(jù)本法頒布條例的行為應被視為違反《聯(lián)邦貿易委員會法》(Federal Trade Commission)第18條(a)(1)(B)條下的不公平或欺騙性行為相關規(guī)定……委員會將以《聯(lián)邦貿易委員會法》(15 U.S.C. 41 et seq.)完全相同的執(zhí)行方式、手段、管轄權、權利和義務執(zhí)行本法案?!贝送?,美國各州檢察長同樣有權利對該法案進行執(zhí)行,代表該州居民向聯(lián)邦地區(qū)法院提起民事訴訟以主張禁令或損害賠償?shù)取6鴼W盟《人工智能法》針對第五十三條下義務的執(zhí)行僅明確規(guī)定了通用型人工智能提供者對成員國人工智能主管機關負有相關透明度義務,執(zhí)行手段也基本局限于針對信息披露的預防性政策制定的審查。
第四,美國《COPIED法案》與歐盟《人工智能法》的透明度義務性質不同。美國《COPIED法案》第四節(jié)與第五節(jié)分別指令美國商務部負責標準和技術事務部(Under Secretary of Commerce for Standards and Technology)以及NIST會同USPTO以及美國版權局制定有關內容來源信息、水印和合成內容檢測的準則和標準的自愿性指南,該指南將涵蓋AI合成內容的識別、來源的披露以及出處信息以及水印的標識標準等。這意味著即使美國《COPIED法案》在執(zhí)行以及救濟方面進行了明確規(guī)定,但其核心的信息來源標注、AI生成內容檢測、出處標識等實操標準將大幅依靠NIST擬定的自愿性指南。而歐盟《人工智能法》對通用型人工智能的主要監(jiān)管手段即針對強制信息披露義務,旨在有效地便于相關主管機關以及公眾(即著作權人)檢測到相關侵權行為的發(fā)生,第五十三條第(a)項要求GPAIM提供者將模型訓練的相關技術文件提供至人工智能主管機關,旨在利于主管機關保護公共利益進行監(jiān)管,而第(b)項要求提供者將數(shù)據(jù)訓練內容的摘要向公眾公布,旨在便于公眾主張私人權益。
四、美歐人工智能著作權規(guī)則對我國的啟示
美歐作為生成式人工智能產(chǎn)業(yè)發(fā)展和監(jiān)管的兩大主要法域,美國《COPIED法案》和歐盟《人工智能法》均體現(xiàn)了其圍繞著作權限制以及限制例外的相關規(guī)定對生成式人工智能著作權保護的規(guī)管方式。美歐在生成式人工智能著作權保護上存在差異,美國《COPIED法案》在法律執(zhí)行以及個人權利救濟規(guī)定的完善程度似乎超越了歐盟《人工智能法》,但該法案對于實際的出處標識、來源信息披露以及合成內容檢測的具體操作標準將取決于有待擬定的自愿性行業(yè)準則,其是否能有效幫助生成式人工智能環(huán)境下版權人針對侵權行為進行監(jiān)測和維權仍有待進一步觀察。相較于美國《COPIED法案》,歐盟《人工智能法》未提及版權人的私法救濟問題,唯一關于維權救濟僅有該法第九章第4節(jié)“自然人或法人可以向主管機構提交訴請或投訴(Complaint)”,這一做法已經(jīng)在《人工智能法》形成階段受到廣泛爭議,較多評述認為[14],相關著作權侵權責任以及司法救濟已經(jīng)由各國現(xiàn)行著作權法所規(guī)制,歐盟《人工智能法》作為一種“meta regulation”[15]的立法形式,不宜對著作權法這一司法領域進行過于提前的干預,而傾向于從預防角度改善人工智能模型訓練數(shù)據(jù)的透明度,這一做法或將更有助于解決人工智能黑箱所造成的版權人維權難的問題。
美國《COPIED法案》和歐盟《人工智能法》的差異對我國著作權制度的啟示。對于美國《COPIED法案》和歐盟《人工智能法》對我國生成式人工智能有關著作權制度創(chuàng)新的啟示而言,通過上述比對分析體現(xiàn)在三個方面。
第一,在制度導向方面,建議立足于平衡生成式人工智能發(fā)展所必需的數(shù)據(jù)資源支撐與著作權人合法權利保護兩個方面構建相關制度。在生成式人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展以及保護傳統(tǒng)著作權人合法權益之間尋求平衡,或將成為生成式人工智能著作權制度創(chuàng)新和監(jiān)管模式的重要命題之一。亦即,既要發(fā)揮著作權法“創(chuàng)新之法”的價值促進生成式人工智能產(chǎn)業(yè)創(chuàng)新,又要發(fā)揮著作權法“產(chǎn)業(yè)之法”的價值促進生成式人工智能產(chǎn)業(yè)發(fā)展。
第二,在制度內容方面,透明度和信息來源的披露義務是可以探討的基礎性規(guī)則,同時需要考慮該義務對產(chǎn)業(yè)帶來的成本和效益。結合對美國《COPIED法案》和歐盟《人工智能法》的分析,透明度和信息來源的披露義務或能有效改善人工智能數(shù)據(jù)訓練黑箱所造成的維權障礙,但相關披露義務性質及監(jiān)管力度將顯著增加人工智能提供者的義務負擔,增加產(chǎn)業(yè)的合規(guī)成本,上述美英兩國相關舉措的差異也體現(xiàn)其在監(jiān)管比例性和適度性上的政策性調配。
第三,在制度創(chuàng)新方面,合理使用制度、法定許可制度或著作權集體管理制度等著作權制度的適用范圍將成為生成式人工智能著作權合規(guī)的重要切入點。我國亦面臨是否有必要就文本與數(shù)據(jù)挖掘的著作權限制制度進行著作權制度創(chuàng)新,以及是否以合理使用、法定許可或著作權集體管理組織的方式進行該制度創(chuàng)新等問題,已有較多學界討論認為,有必要創(chuàng)造文本和數(shù)據(jù)挖掘制度,但需要限定制度的適用范圍,結合生成式人工智能的發(fā)展前景,充分考慮法定許可、著作權集體管理等制度模式的拓展空間[16]。
注釋:
1.李陶:“歐盟《人工智能法》對我國著作權制度創(chuàng)新的啟示”[J],載于《版權理論與實務》2024年第5期。
2.https://www.commerce.senate.gov/services/files/3012CB20-193B-4FC6-8476-DDE421F3DB7A,2024年8月14日最后訪問。
3.Recital (107),“為了提高通用人工智能模型的預訓練和訓練中使用的數(shù)據(jù)的透明度,包括受版權法保護的文本和數(shù)據(jù),此類模型的提供者應就通用模型訓練中使用的內容制定并公開足夠詳細的摘要。在適當考慮保護商業(yè)秘密和商業(yè)機密信息的同時,該摘要的范圍應在總體上全面,而不是在技術上詳細,以方便包括版權持有者在內的合法權益方行使和執(zhí)行其在歐盟法律下的權利,例如列出用于訓練模型的主要數(shù)據(jù)收集或數(shù)據(jù)集,如大型的私有或公共的數(shù)據(jù)庫或數(shù)據(jù)檔案,并對所使用的其他數(shù)據(jù)來源進行敘述性的解釋。人工智能辦公室宜提供一個摘要模板,該模板應簡單、有效,并允許提供者以敘述形式提供所需的摘要?!?/p>
4.《數(shù)字單一市場版權指令》(CDSMD)第2條第1款第2項,“文本和數(shù)據(jù)挖掘”是指一種以數(shù)字形式自動分析文本和數(shù)據(jù)的技術,可用于獲取有關但不限于模式、趨勢和相關性的信息。
5.相關情況參見劉曉春、夏杰:“美國人工智能立法態(tài)勢介評”[J],載于《中國對外貿易》2023年第10期。
6.“The Content Origin Protection and Integrity from Edited and Deepfaked Media Act of 2024 [COPIED Act]”. https://www.commerce.senate.gov/services/files/359B6D81-5CB4-4403-A99F-152B99B17C30.
7.Major Endorsements. https://www.commerce.senate.gov/2024/7/cantwell-blackburn-heinrich-introduce-legislation-to-combat-ai-deepfakes-put-journalists-artists-songwriters-back-in-control-of-their-content.
8.參見(2024)粵0192民初113號民事判決書。
9.李青文:“算法訓練使用作品的著作權法規(guī)制路徑”[J],載于《科技與出版》,2024(7):16-27.
10.17 U. S. C. §107.
11.Authors Guild, Inc.v. Google Inc.,804 F.3d 202,2nd Cir.(N. Y.), Oct.16,2015.相關討論參見Angel Siegfried Diaz, Fair Use & Mass Digitizat ion: The Future of Copy-Dependent Technologies After Authors Guild v.Hathitrust,2013,28 Berkeley Tech. L. J.683(2013).
12.“AI music startups say copyright violation is just rock and roll”, https://www.theverge.com/2024/8/2/24211842/ai-music-riaa-copyright-lawsuit-suno-udio-fair-use.
13.Section 2, (3) “這些缺陷(指人工智能著作權侵權相關問題)對公眾產(chǎn)生了負面影響,特別是對記者、出版商、廣播公司和藝術家產(chǎn)生了負面影響,他們權利內容被用來訓練這些系統(tǒng),并縱以產(chǎn)生合成內容和合成修改的內容,這些內容在數(shù)字市場上與涵蓋的內容進行不公平競爭……”
14.Alexander Peukert, “Copyright in the Artificial Intelligence Act – A Primer”, GRUR International, Volume 73, Issue 6, June 2024, Pages 497–509. Available at: https://doi.org/10.1093/grurint/ikae057.
15.Recital 9; Coglianese/Mendelson, Meta-regulation and self-regulation, in: Baldwin/Cave/Lodge (eds.), The Oxford Handbook of Regulation, 2010, 146, 150.
16.李陶,“歐盟《人工智能法》對我國著作權制度創(chuàng)新的啟示”[J],載于《版權理論與實務》2024年第5期。
?