亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)風(fēng)險及應(yīng)對

        2025-08-03 00:00:00金宇菲
        出版與印刷 2025年3期
        關(guān)鍵詞:著作權(quán)人許可人工智能

        DOI: 10.19619/j.issn.1007-1938.2025.00.026作者單位:

        引文格式:.生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)風(fēng)險及應(yīng)對[J].出版與印刷,2025(3):38-49.

        一、引言

        數(shù)據(jù)是構(gòu)筑數(shù)字經(jīng)濟(jì)大廈的基石磚瓦,也是支撐人工智能大模型發(fā)展的根基。從國家總體戰(zhàn)略布局來看,數(shù)據(jù)資源是發(fā)展新質(zhì)生產(chǎn)力的核心與關(guān)鍵。黨的二十屆三中全會審議通過《中共中央關(guān)于進(jìn)一步全面深化改革推進(jìn)中國式現(xiàn)代化的決定》,著重強(qiáng)調(diào)要健全促進(jìn)實(shí)體經(jīng)濟(jì)和數(shù)字經(jīng)濟(jì)深度融合制度。在具體舉措上,國家相繼頒布實(shí)施《網(wǎng)絡(luò)數(shù)據(jù)安全管理條例》《“數(shù)據(jù)要素 × ”三年行動計劃(2024—2026年)》等規(guī)范性文件,旨在打造數(shù)據(jù)保護(hù)新格局,釋放數(shù)據(jù)要素價值,推動新質(zhì)生產(chǎn)力發(fā)展。

        近年來,ChatGPT、文心一言、Sora等生成式人工智能相繼問世,這些生成式人工智能的訓(xùn)練以大量數(shù)據(jù)“投喂”為基礎(chǔ),其訓(xùn)練過程潛藏著著作權(quán)侵權(quán)風(fēng)險,給傳統(tǒng)著作權(quán)制度帶來巔覆性挑戰(zhàn)。在生成式人工智能的訓(xùn)練環(huán)節(jié),針對訓(xùn)練數(shù)據(jù)的使用,數(shù)據(jù)產(chǎn)權(quán)人與數(shù)據(jù)使用人之間存在利益沖突,但目前既有規(guī)則對此問題尚未能充分關(guān)注。2023年國家互聯(lián)網(wǎng)信息辦公室等七部門聯(lián)合頒布的《生成式人工智能服務(wù)管理暫行辦法》第七條規(guī)定,生成式人工智能服務(wù)提供者應(yīng)當(dāng)依法開展訓(xùn)練數(shù)據(jù)處理活動,使用具有合法來源的數(shù)據(jù),不得侵害他人依法享有的知識產(chǎn)權(quán)。人工智能產(chǎn)業(yè)的進(jìn)步需要海量數(shù)據(jù)的支持,這些數(shù)據(jù)往往源自各類版權(quán)作品,對于著作權(quán)人而言,他們不應(yīng)成為新興技術(shù)發(fā)展的犧牲品,如何緩解技術(shù)創(chuàng)新與著作權(quán)保護(hù)間的矛盾,讓每個著作權(quán)人共享時代發(fā)展紅利,是發(fā)展新質(zhì)生產(chǎn)力過程中的重要課題。綜上,本文將在闡明生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)樣態(tài)的基礎(chǔ)上,梳理并反思既有規(guī)制方案,提出以包容審慎規(guī)制理念為核心的訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)風(fēng)險的規(guī)制思路

        二、生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)的風(fēng)險生成

        1.生成式人工智能訓(xùn)練數(shù)據(jù)侵權(quán)的前提厘定

        大模型構(gòu)建前端所涉及的法律問題中,與著作權(quán)最密切相關(guān)的是訓(xùn)練數(shù)據(jù)來源的合法性問題。然而并非一切數(shù)據(jù)都屬于《中華人民共和國著作權(quán)法》(簡稱“著作權(quán)法”)保護(hù)的范圍,只有符合版權(quán)作品構(gòu)成要求的,才能成為著作權(quán)法的保護(hù)對象。

        生成式人工智能訓(xùn)練數(shù)據(jù)依據(jù)不同的獲取途徑,主要可分為三類。一是自研數(shù)據(jù),人工智能開發(fā)者可以基于需求,依托自身提供的其他產(chǎn)品或服務(wù)獲取數(shù)據(jù),例如,百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司(簡稱“百度”)通過百度地圖中的收藏打卡和評價信息、百度翻譯中的查詢記錄等,為其人工智能研發(fā)積累各種數(shù)據(jù)。這種自研數(shù)據(jù)權(quán)屬明確,在使用中不涉及著作權(quán)侵權(quán)問題。二是授權(quán)獲得的他方數(shù)據(jù),包括合作主體間的數(shù)據(jù)交易和共建共享、專業(yè)數(shù)據(jù)服務(wù)商所提供的數(shù)據(jù)等,此種情況下的數(shù)據(jù)即便構(gòu)成版權(quán)作品,對其進(jìn)行的抓取使用通常也獲得了權(quán)利人的許可,不涉及著作權(quán)侵權(quán)問題。三是公開渠道獲得的數(shù)據(jù),基于公開的數(shù)據(jù)進(jìn)行大量模型訓(xùn)練,是人工智能企業(yè)降低成本的首選。從數(shù)據(jù)個體來看,單個文獻(xiàn)、期刊、報告等內(nèi)容在符合獨(dú)創(chuàng)性等著作權(quán)保護(hù)條件時方屬于本文所探討的作品范圍。但同時,公開的數(shù)據(jù)還會以數(shù)據(jù)集的形式呈現(xiàn)。數(shù)據(jù)集的組成內(nèi)容即單個數(shù)據(jù),在判斷是否應(yīng)受著作權(quán)保護(hù)時與數(shù)據(jù)個體無二,但從整體來看,數(shù)據(jù)集本身要構(gòu)成作品,則需強(qiáng)調(diào)獨(dú)創(chuàng)性,體現(xiàn)制作者富有個性化的選擇、編排,即“若是作品數(shù)據(jù)集合的控制者對其中作品的選擇或編排作出了具有獨(dú)創(chuàng)性的貢獻(xiàn),則能夠從整體上主張該作品數(shù)據(jù)集合構(gòu)成匯編作品”。反之,若爬取的數(shù)據(jù)集不體現(xiàn)獨(dú)創(chuàng)性,盡管其包含大量信息和資源,如從電商平臺網(wǎng)站收集的消費(fèi)者商品點(diǎn)評、手機(jī)地圖中的實(shí)時數(shù)據(jù)庫等,亦不構(gòu)成著作權(quán)侵權(quán)的前提條件。

        可見,訓(xùn)練數(shù)據(jù)侵權(quán)以公開渠道獲得的數(shù)據(jù)為主要對象,關(guān)系到符合版權(quán)作品要求的單個數(shù)據(jù)權(quán)屬問題,特定條件下還涉及作為匯編作品的數(shù)據(jù)集整體,本文所討論的數(shù)據(jù)皆符合此項前提。由于數(shù)據(jù)產(chǎn)權(quán)人和人工智能開發(fā)者往往不是同一主體,如何確保這些數(shù)據(jù)的使用符合著作權(quán)法規(guī)定,是人工智能產(chǎn)業(yè)發(fā)展亟待解決的問題。

        2.生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)的風(fēng)險樣態(tài)

        人工智能作為一種深度學(xué)習(xí)模型,其底層邏輯與訓(xùn)練數(shù)據(jù)息息相關(guān),其訓(xùn)練過程可以分解為輸入、利用和輸出三個主要階段。在厘清數(shù)據(jù)與作品關(guān)系的基礎(chǔ)上,應(yīng)當(dāng)將各階段的數(shù)據(jù)使用置于著作權(quán)法的基本理念和規(guī)范之下,探討不同階段的著作權(quán)侵權(quán)風(fēng)險樣態(tài)。

        (1)輸入階段的侵權(quán)風(fēng)險樣態(tài)生成式人工智能輸入階段的主要行為模式是數(shù)據(jù)抓取,侵權(quán)風(fēng)險在樣態(tài)上表現(xiàn)為侵犯復(fù)制權(quán)。人工智能首先挖掘大量與指令要求相關(guān)的數(shù)據(jù),包括圖像、文字、音頻等,再“對大量數(shù)據(jù)進(jìn)行分類、聚類,提煉不同類型作品的數(shù)據(jù)特征,‘找出’訓(xùn)練數(shù)據(jù)中的規(guī)律,‘理解’訓(xùn)練數(shù)據(jù)的內(nèi)容”[2]。這種數(shù)據(jù)挖掘一般涵蓋收集、下載、標(biāo)注、提取等環(huán)節(jié),難免需要對數(shù)據(jù)進(jìn)行復(fù)制。復(fù)制行為分為永久復(fù)制和臨時復(fù)制,前者指將作品固定于有形媒介,實(shí)現(xiàn)長期存儲和反復(fù)使用,如刻錄光盤等;后者則是指在技術(shù)運(yùn)行過程中短暫、自動產(chǎn)生的復(fù)制行為,如網(wǎng)頁瀏覽緩存、媒體播放緩存等,通常在設(shè)備重啟或程序關(guān)閉后會自動清除數(shù)據(jù)。關(guān)于永久復(fù)制,國內(nèi)外看法一致,均認(rèn)定其屬于復(fù)制權(quán)的涵蓋范圍,但永久復(fù)制并不必然構(gòu)成著作權(quán)侵權(quán),超出合理使用范圍、非法數(shù)據(jù)抓取等才屬于侵犯復(fù)制權(quán)范疇。但在關(guān)于臨時復(fù)制是否會構(gòu)成侵權(quán)的問題上,各國仍存在較大爭議。美國和歐盟認(rèn)為臨時復(fù)制應(yīng)屬復(fù)制行為的基本形式之一,同樣潛藏著復(fù)制權(quán)侵權(quán)的風(fēng)險。就我國而言,無論是所加人或承認(rèn)的國際公約,還是國內(nèi)制定的《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,均未明確將臨時復(fù)制納入侵犯著作權(quán)的行為范疇。因此在我國數(shù)據(jù)抓取階段的著作權(quán)侵權(quán)行為主要表現(xiàn)為永久復(fù)制行為。

        (2)利用階段的侵權(quán)風(fēng)險樣態(tài)

        利用數(shù)據(jù)階段作為人工智能大模型開展機(jī)器學(xué)習(xí)的重要環(huán)節(jié),需要對數(shù)據(jù)進(jìn)行處理和特征提取,在這種行為下產(chǎn)生的著作權(quán)侵權(quán)風(fēng)險主要表現(xiàn)為侵犯改編權(quán)、匯編權(quán)和翻譯權(quán)。改編權(quán)和匯編權(quán)所規(guī)制的行為是將原作品或片段改編或匯集成新作品。對生成式人工智能而言,獲取海量數(shù)據(jù)后通常會對數(shù)據(jù)進(jìn)行初步去重、清洗,這種基礎(chǔ)的篩選行為通常需要根據(jù)指令對數(shù)據(jù)進(jìn)行翻譯、改編或者匯編,從而構(gòu)建基本數(shù)據(jù)集,并在此基礎(chǔ)上進(jìn)一步開展對作品中的思想感情、研究角度、表達(dá)方法的學(xué)習(xí)。當(dāng)依據(jù)指令篩選構(gòu)建的數(shù)據(jù)集具備一定程度的獨(dú)創(chuàng)性時,這種對數(shù)據(jù)的選擇、整理、組合等使用行為,就可能產(chǎn)生對翻譯權(quán)、改編權(quán)、匯編權(quán)的侵權(quán)風(fēng)險。

        但相較于輸入和輸出階段,利用階段對著作權(quán)的侵權(quán)風(fēng)險更為隱蔽。一方面,無論是對作品進(jìn)行翻譯還是改編、匯編,最終是以向機(jī)器呈現(xiàn)基礎(chǔ)數(shù)據(jù)集的方式表現(xiàn),權(quán)利人對此過程性侵權(quán)行為往往難以知曉并獲取證據(jù);另一方面,作為連接訓(xùn)練數(shù)據(jù)前端和后端的橋梁,僅針對利用階段的侵權(quán)行為提起訴訟的情況并不常見,實(shí)踐中的案例也表明,著作權(quán)人通常是基于輸入或輸出階段的侵權(quán)行為提起訴訟,以降低訴訟難度、提高獲勝可能。

        (3)輸出階段的侵權(quán)風(fēng)險樣態(tài)

        在輸出階段,人工智能大模型基于輸入階段的海量數(shù)據(jù)生成內(nèi)容。在生成的內(nèi)容中,每個作品的表達(dá)通常以少量片段的形式呈現(xiàn)。只有在訓(xùn)練數(shù)據(jù)量極少或算法錯誤的時候,才會出現(xiàn)部分或全部復(fù)制原作品的情況。因此,通常情況下不會構(gòu)成對復(fù)制權(quán)的侵犯。但如果對作品的分析過程和具體內(nèi)容進(jìn)行傳播,卻可能會引發(fā)侵犯廣播權(quán)和信息網(wǎng)絡(luò)傳播權(quán)的風(fēng)險。例如,在《紐約時報》訴OpenAI及微軟案3中,原告認(rèn)為,被告在GPT模型訓(xùn)練期間未經(jīng)授權(quán)復(fù)制或提取了報刊作品,且至少通過兩種方式未經(jīng)授權(quán)公開展示了這些作品,這種在訓(xùn)練大語言模型和運(yùn)營相關(guān)AI產(chǎn)品過程中,以多種方式創(chuàng)建和傳播包含《紐約時報》內(nèi)容的復(fù)制品的行為,侵犯了其信息網(wǎng)絡(luò)傳播權(quán)。具體而言,在實(shí)踐中,為了獲得人工智能算法反饋、共享生成過程數(shù)據(jù)或驗證研究結(jié)果的準(zhǔn)確性,人工智能開發(fā)者會將對作品的檢索、分析過程進(jìn)行公開發(fā)布,此種情境下“將機(jī)器學(xué)習(xí)的數(shù)據(jù)分析結(jié)果通過網(wǎng)絡(luò)即時公開發(fā)布,可能會侵犯作品的廣播權(quán);若延時發(fā)布,則可能侵犯作品的信息網(wǎng)絡(luò)傳播權(quán)”[4]133 。

        三、生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)規(guī)制的現(xiàn)狀審視

        在生成式人工智能著作權(quán)侵權(quán)案中,訓(xùn)練數(shù)據(jù)使用者常常主張許可使用和合理使用來消除其行為的違法性。許可使用意為一經(jīng)許可即可使用,是最典型的著作權(quán)侵權(quán)豁免規(guī)則,具體包括授權(quán)許可、法定許可、強(qiáng)制許可和默示許可;合理使用是指允許使用者在一定條件下不經(jīng)作者許可而使用其作品。著作權(quán)法是利益平衡的產(chǎn)物,許可使用和合理使用作為不可或缺的兩項制度,在實(shí)現(xiàn)著作權(quán)法既促進(jìn)科技創(chuàng)新又激發(fā)創(chuàng)造活力的規(guī)范目的中發(fā)揮了重要作用,然而,當(dāng)兩者被生成式人工智能使用者作為抗辯事由時,均存在一定的理論缺陷。

        1.對許可使用相關(guān)規(guī)定的學(xué)理檢視

        我國著作權(quán)法尚未對強(qiáng)制許可制度作出明確規(guī)定,因而若將許可使用作為人工智能大模型數(shù)據(jù)訓(xùn)練的侵權(quán)抗辯事由,則主要集中在授權(quán)許可、法定許可和默示許可三種模式上。但這三種模式都存在缺陷,具體如下。

        (1)授權(quán)許可模式及其缺陷

        授權(quán)許可模式是指數(shù)據(jù)使用者通過支付使用費(fèi)用的方式獲取著作權(quán)人的個別授權(quán)。作為最傳統(tǒng)的模式,“許可 + 付費(fèi)”能夠遵從著作權(quán)人的真實(shí)意思,確保著作權(quán)人能取得智力成果的合理使用對價,符合利益自決的基本授權(quán)邏輯。但隨著新技術(shù)迅猛發(fā)展,該模式存在較為顯著的弊端。首先,授權(quán)許可有悖著作權(quán)法鼓勵創(chuàng)新的宗旨。訓(xùn)練數(shù)據(jù)的分散和許可費(fèi)用的高昂不利于使用者大規(guī)模獲取數(shù)據(jù),將在客觀上制約技術(shù)創(chuàng)新。其次,授權(quán)許可可能對使用者產(chǎn)生逆向激勵效應(yīng),誘發(fā)其侵權(quán)風(fēng)險。原因在于,復(fù)雜的許可條款可能會存在按使用量計費(fèi)、區(qū)域限制升級費(fèi)等隱性成本,當(dāng)基礎(chǔ)許可費(fèi)疊加隱性成本顯著高于侵權(quán)成本(如法律風(fēng)險、技術(shù)破解成本)時,使用者可能選擇規(guī)避授權(quán)、冒險侵權(quán)。此外,訓(xùn)練數(shù)據(jù)獲取條件嚴(yán)苛、使用范圍過窄、使用靈活度差等問題也進(jìn)一步減損了授權(quán)許可的適用空間。[5]

        (2)法定許可模式及其缺陷

        為了克服市場失靈,滿足社會需要,同時又不過于損害著作權(quán)人的利益,法定許可制度應(yīng)運(yùn)而生。法定許可,是指特定主體在特定情形下,以法定條件和方式使用已經(jīng)發(fā)表的作品,可以不經(jīng)著作權(quán)人許可,但須向著作權(quán)人支付合理報酬的制度。相較于授權(quán)許可和合理使用,法定許可更具中庸之道,不僅為人工智能開發(fā)者創(chuàng)造了高效率的合作機(jī)會,還保障著作權(quán)人能從訓(xùn)練數(shù)據(jù)中獲益。然而,法定許可受限于特定情形,就現(xiàn)行立法而言,人工智能訓(xùn)練數(shù)據(jù)的使用場景難以契合法定許可所涵蓋的類型。此外,從本質(zhì)上講,法定許可剝奪了著作權(quán)人在特定情況下基于其作品進(jìn)行議價的權(quán)利,轉(zhuǎn)而采用由國家制定的統(tǒng)一定價。若以法定許可來規(guī)范人工智能訓(xùn)練數(shù)據(jù)的使用,就應(yīng)盡快制定并出臺相應(yīng)的定價標(biāo)準(zhǔn)、法律規(guī)范、技術(shù)要求等,配套建立開放透明的公共平臺和監(jiān)督體系。但這些在短期內(nèi)均難以實(shí)現(xiàn)。

        (3)默示許可模式及其缺陷

        前兩種許可屬于“選擇進(jìn)入”的模式,即需要得到授權(quán)才能使用作品,而默示許可模式不同,是以“選擇退出”為基礎(chǔ),意指用戶在未經(jīng)著作權(quán)人事先同意而使用時,可以根據(jù)著作權(quán)人的沉默過程推斷該許可成立,但當(dāng)著作權(quán)人做出退出選擇,即明示不再授權(quán)用戶使用時,用戶的使用資格也隨之退出??梢钥闯?,默示許可作為一種相對溫和的“弱限制性規(guī)則”,功能的發(fā)揮建立在對著作權(quán)人知情權(quán)、獲酬權(quán)、拒絕權(quán)予以充分尊重的基礎(chǔ)上。但事實(shí)上,這種對著作權(quán)人的權(quán)利保障在海量數(shù)據(jù)面前并不具可操作性。“‘權(quán)利人沒有明確拒絕即視為同意’的前提是權(quán)利人知悉作品將被使用,‘知悉’在理論建構(gòu)上并不困難,在實(shí)踐操作中卻并非易事?!盵即便有人工智能開發(fā)者為作品著作權(quán)人提供公示和查詢平臺,但想要通過逐條甄別實(shí)現(xiàn)“知悉”在實(shí)際操作中也并不現(xiàn)實(shí)。

        2.對合理使用相關(guān)規(guī)定的學(xué)理檢視

        鑒于許可使用在人工智能侵權(quán)領(lǐng)域存在著高成本、低效率、難操作等不足,目前司法實(shí)踐更加傾向于以合理使用制度處理此類問題。關(guān)于合理使用,國際上存在著“規(guī)則主義”和“因素主義”兩種不同的立法模式,[8](見表1)在生成式人工智能迅速發(fā)展的背景下,合理使用制度展現(xiàn)出一定的比較優(yōu)勢,但也暴露出若干理論層面的缺陷。

        (1)“規(guī)則主義”立法模式及評析

        在“規(guī)則主義”立法模式下,三步檢驗法是關(guān)于合理使用的常用判斷標(biāo)準(zhǔn),即依次判斷是否符合合理使用的特定情形、是否與作品的正常利用相沖突、是否不合理地?fù)p害了著作權(quán)人的合法權(quán)益。

        首先,在判斷是否符合合理使用的特定情形時,生成式人工智能的數(shù)據(jù)使用行為一般難以滿足。以我國為例,最可能作為人工智能數(shù)據(jù)使用行為抗辯理由的是“個人學(xué)習(xí)”“適當(dāng)引用”和“科學(xué)研究”三種情形。然而,這三種情形均有嚴(yán)格的適用條件:“個人學(xué)習(xí)”要求不以營利為自的;“適當(dāng)引用”需滿足“為介紹、評論某一作品或者說明某一問題”的特定目的;“科學(xué)研究”則限定于科研主體。對于通常由營利性的互聯(lián)網(wǎng)公司開發(fā)、訓(xùn)練數(shù)據(jù)目的在于輸出的生成式人工智能來說,顯然都不適用。對此,有學(xué)者提出增設(shè)針對生成式人工智能合理使用的專門條款或采用開放性條款[以擴(kuò)充合理使用的法定情形。在比較法上,歐盟也進(jìn)一步擴(kuò)充了合理使用的范圍,在《數(shù)字單一市場版權(quán)指令》(Directive on Copyright in the Di-gitalSinglesMarket)中針對文本和數(shù)據(jù)挖掘行為,增加了兩項版權(quán)與數(shù)據(jù)庫特殊權(quán)利的侵權(quán)例外制度。此種立法思路可為我國著作權(quán)法所借鑒。

        其次,在判斷是否與原作品的正常利用相沖突時,通常要求對原作品的使用次數(shù)和范圍進(jìn)行限制,這明顯與人工智能開展數(shù)據(jù)訓(xùn)練的基本需求相違背,

        最后,人工智能開展數(shù)據(jù)訓(xùn)練的過程中很有可能構(gòu)成對作品復(fù)制權(quán)、匯編權(quán)、信息網(wǎng)絡(luò)傳播權(quán)等權(quán)益的侵害。對此,日本采取的態(tài)度是不強(qiáng)制人工智能訓(xùn)練中使用的數(shù)據(jù)符合版權(quán)法,不保護(hù)訓(xùn)練數(shù)據(jù)所用資料的版權(quán)。[這種絕對化的立場遭到了不少議員和版權(quán)企業(yè)的質(zhì)疑,這種以無版權(quán)換取人工智能競爭力的方式顯然也因不符合我國國情而缺乏借鑒意義。歐盟《人工智能法》(Artifi-cialIntelligenceAct)則是基于風(fēng)險對人工智能的數(shù)據(jù)使用行為作出規(guī)制,然而就數(shù)據(jù)訓(xùn)練層面而言,該法案只是從正面提出要求,即人工智能模型開發(fā)者需詳細(xì)說明使用了哪些內(nèi)容來訓(xùn)練所研發(fā)的系統(tǒng),并確保遵守歐盟版權(quán)法的規(guī)定,但該法案缺乏判斷不合理損害著作權(quán)人合法權(quán)益的明確標(biāo)準(zhǔn)。

        表1“合理使用”的兩種立法模式

        (2)“因素主義”立法模式及評析

        美國法院在司法案例中逐漸形成了以“使用的目的及性質(zhì)”“享有版權(quán)保護(hù)作品的性質(zhì)”“被使用部分的數(shù)量及其性質(zhì)”及“使用行為對原作品潛在市場或其價值的影響”等因素作為判斷合理使用制度適用性的標(biāo)準(zhǔn)。其中,“使用的目的及性質(zhì)”作為判斷使用行為正當(dāng)性的基礎(chǔ),亦會影響其他要素的認(rèn)定,因而法院通常將其作為首要因素予以優(yōu)先考慮,本文也將以此為代表進(jìn)行分析。

        一方面,為判斷“使用的目的及性質(zhì)”,美國司法實(shí)踐對轉(zhuǎn)換性使用這一特色理論,根據(jù)人工智能時代的發(fā)展背景做了新的闡釋。轉(zhuǎn)換性使用原指在新作品對原作品的使用過程中,賦予原作品新的價值、功能或性質(zhì),從而改變了原先的功能或目的。2023年,美國最高法院特別強(qiáng)調(diào),轉(zhuǎn)換性使用的認(rèn)定是一個程度問題,關(guān)鍵是看對原作品的使用“是否且在多大程度上”與原作品具有目的和性質(zhì)上的不同。[12]換言之,可以從目的和內(nèi)容兩個方面進(jìn)行判斷:當(dāng)人工智能大模型對原作品的使用足以產(chǎn)生新的價值、功能或性質(zhì)時,無論是在數(shù)據(jù)輸入還是內(nèi)容輸出階段,都呈現(xiàn)出與原作品不同的表達(dá)形式或用途,且不會對原作品形成市場替代或?qū)е缕鋬r值減損,在此情形下適用合理使用制度的理由就更為充分。這種保障舊權(quán)利、鼓勵新價值的利益平衡機(jī)制也為我國法律適應(yīng)新技術(shù)發(fā)展提供了借鑒。

        但另一方面,美國司法實(shí)踐中對于“使用的目的及性質(zhì)”的判定仍未形成統(tǒng)一標(biāo)準(zhǔn),這在一定程度上減損了“因素主義”模式的司法適用性。對作品使用的目的和性質(zhì)的判斷,實(shí)質(zhì)上是在“思想與表達(dá)二分法”下,將人工智能對作品的非表達(dá)性使用排除在侵權(quán)之外,因此明確表達(dá)性使用與非表達(dá)性使用的界限就十分關(guān)鍵。有學(xué)者認(rèn)為人工智能創(chuàng)作對于作品的使用屬于“表達(dá)性使用”一這種使用“并非針對原作品的事實(shí)性信息,而是其中的獨(dú)創(chuàng)性表達(dá);使用的結(jié)果也并非實(shí)現(xiàn)了所謂目的性或者功能性轉(zhuǎn)換,而是形成了與原作品有關(guān)聯(lián)的新作品”[4131。也有反對觀點(diǎn)主張構(gòu)成人工智能創(chuàng)作對于作品的使用屬于“非表達(dá)性使用”,認(rèn)為“無論模型訓(xùn)練的目的是什么,其背后的技術(shù)邏輯是一樣的,本質(zhì)上都是從數(shù)據(jù)中計算出概率,形成表達(dá)范式,無論是模型本身還是模型背后的開發(fā)者,都未產(chǎn)生對作品中的表達(dá)的理解和欣賞”[13]。因此,作品被輸人計算機(jī)中只是作為被分析與挖掘的語料,在這過程中并未被閱讀、欣賞,也沒有在計算機(jī)中以人類能夠閱讀的方式再現(xiàn)。[14]實(shí)踐中,美國法院的裁決并沒有對人工智能訓(xùn)練數(shù)據(jù)是否構(gòu)成表達(dá)性使用給出統(tǒng)一標(biāo)準(zhǔn),相關(guān)理論和實(shí)踐都有待完善。

        四、生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)風(fēng)險的規(guī)制思路

        從以上分析可以看出,防范生成式人工智能訓(xùn)練數(shù)據(jù)的侵權(quán)風(fēng)險需要妥善處理好兩個問題:一是如何防止輸入和輸出兩個階段侵權(quán)風(fēng)險的生成,二是應(yīng)怎樣對當(dāng)前的合理使用制度作出調(diào)整以適應(yīng)發(fā)展需求。為此,應(yīng)著眼于對著作權(quán)法及相關(guān)制度規(guī)范的完善,在秉持利益平衡、包容審慎原則的基礎(chǔ)上對上述問題作出回應(yīng)

        1.在輸入階段保障訓(xùn)練數(shù)據(jù)的來源合法

        數(shù)據(jù)來源是否符合著作權(quán)法的規(guī)定,對訓(xùn)練數(shù)據(jù)輸入階段乃至整個流程的風(fēng)險規(guī)避起到舉足輕重的作用??梢钥紤]從規(guī)范數(shù)據(jù)收集方式和健全訓(xùn)練數(shù)據(jù)著作權(quán)信息披露規(guī)范入手,保障輸入階段數(shù)據(jù)來源的合法性,從源頭降低著作權(quán)侵權(quán)風(fēng)險產(chǎn)生的可能性

        (1)規(guī)范數(shù)據(jù)收集方式

        首先,應(yīng)當(dāng)采取更加高效的訓(xùn)練數(shù)據(jù)收集方式。在比較法中,日本于2023年對其著作權(quán)法進(jìn)行修改,規(guī)定當(dāng)作品著作權(quán)人授權(quán)意向不明時,使用者可向文部科學(xué)省下屬的文化廳提出裁決申請,經(jīng)文化廳廳長的批準(zhǔn)并支付相應(yīng)補(bǔ)償金后,使用者有權(quán)在指定期限內(nèi)使用該作品。這種臨時許可裁定制度不僅便捷了人工智能產(chǎn)業(yè)對作品的使用,降低了申請門檻,還允許著作權(quán)人申請撤銷許可或獲得相應(yīng)的補(bǔ)償金,從而兼顧了著作權(quán)人的利益。這一做法為我國解決人工智能大模型使用數(shù)據(jù)面臨的“許可使用”困境提供了參考。我國應(yīng)當(dāng)結(jié)合實(shí)際情況,在裁定程序、補(bǔ)償金確定標(biāo)準(zhǔn)等方面作出符合我國國情的考量。一方面,可以考慮設(shè)立獨(dú)立的數(shù)據(jù)裁定委員會,負(fù)責(zé)數(shù)據(jù)的收集審查和裁定使用,構(gòu)建數(shù)據(jù)收集前的用戶同意機(jī)制和數(shù)據(jù)收集中的匿名化處理機(jī)制,確保在透明原則下進(jìn)行裁定,并向著作權(quán)人明確告知數(shù)據(jù)的使用目的、方式和范圍。另一方面,在確定補(bǔ)償金時,應(yīng)對數(shù)據(jù)的貢獻(xiàn)量和市場價值進(jìn)行評估,同時建立動態(tài)調(diào)整機(jī)制,根據(jù)市場變化、技術(shù)進(jìn)步和數(shù)據(jù)價值的波動,及時調(diào)整補(bǔ)償

        金標(biāo)準(zhǔn)。

        此外,基于現(xiàn)有的默示許可制度,可以從以下兩個方面作出完善。一是明確“選擇退出”機(jī)制下人工智能開發(fā)者和作品著作權(quán)人的義務(wù)?!斑x擇退出”機(jī)制下,“原本由數(shù)據(jù)利用者承擔(dān)的監(jiān)管義務(wù)遷移到權(quán)利人身上;對數(shù)據(jù)利用者而言,僅需盡到告知義務(wù)即可,且此種告知義務(wù)的要求較之尋求授權(quán)同意而言更為寬松、成本也更低”[15]。換言之,在訓(xùn)練數(shù)據(jù)的收集過程中,著作權(quán)人需承擔(dān)對作品使用的監(jiān)管責(zé)任,人工智能開發(fā)者則需要確保告知義務(wù)的充分履行,使著作權(quán)人能清楚知悉其作品的使用狀況。二是依托著作權(quán)集體管理機(jī)制使著作權(quán)人能夠及時“知悉”相關(guān)信息。著作權(quán)集體管理組織在管理著作權(quán)人難以直接控制和行使的權(quán)利、實(shí)現(xiàn)著作權(quán)人利益最大化方面,發(fā)揮著重要的作用。在大數(shù)據(jù)時代,有必要進(jìn)一步完善著作權(quán)集體管理模式,發(fā)揮其在默示許可制度中的組織協(xié)調(diào)作用,暢通著作權(quán)人的知情知悉渠道。

        (2)健全訓(xùn)練數(shù)據(jù)著作權(quán)信息披露規(guī)范

        為糾正人工智能大模型開發(fā)者在收集和使用數(shù)據(jù)過程中存在的不透明、不規(guī)范行為,保障輸入階段數(shù)據(jù)來源的合法性,國內(nèi)外均已開始了針對著作權(quán)信息披露的立法實(shí)踐。歐盟在《人工智能法》中要求披露所有的訓(xùn)練數(shù)據(jù)信息,美國也在《人工智能基礎(chǔ)模型透明法案》(AIFoundationModelTranspa-rencyAct)、《生成式人工智能版權(quán)披露法案》(Generative AI Copyright Disclosure Act)等諸多草案中,體現(xiàn)出注重訓(xùn)練數(shù)據(jù)著作權(quán)信息披露的立法動向。

        為探索人工智能訓(xùn)練數(shù)據(jù)著作權(quán)信息披露的中國方案,全國網(wǎng)絡(luò)安全標(biāo)準(zhǔn)化技術(shù)委員會于2024年3月發(fā)布了《生成式人工智能服務(wù)安全基本要求》,其中對語料來源安全要求進(jìn)行了界定,包括語料來源管理、語料來源可追溯等,并向服務(wù)提供者發(fā)出倡議。訓(xùn)練數(shù)據(jù)著作權(quán)信息披露規(guī)范要對披露方式、披露內(nèi)容等給予明確指示,但又要避免給開發(fā)者設(shè)定過高的義務(wù)標(biāo)準(zhǔn)。具體來說,可以考慮搭建披露平臺,以摘要、概述等形式進(jìn)行披露,以提高數(shù)據(jù)透明度;在披露內(nèi)容上,應(yīng)明確標(biāo)注數(shù)據(jù)來源、獲取渠道等,例如數(shù)據(jù)是自研、交換還是爬取所得,公開數(shù)據(jù)集的爬取是基于政府、組織還是個人等?!巴ㄟ^披露關(guān)于訓(xùn)練數(shù)據(jù)收集的信息,社會公眾能夠了解大模型訓(xùn)練數(shù)據(jù)的來源渠道,特別是能及時發(fā)現(xiàn)對關(guān)涉其個人合法權(quán)益的數(shù)據(jù)被收集的事實(shí),以便依法維護(hù)自身權(quán)益?!盵16]

        2.在輸出階段強(qiáng)化對人工智能大模型輸出內(nèi)容的監(jiān)管

        如前文所述,在人工智能大模型訓(xùn)練的輸出階段往往會涉及對廣播權(quán)和信息網(wǎng)絡(luò)傳播權(quán)的侵犯,而這類權(quán)利具有接觸面廣、開放性強(qiáng)的特征,為獲取監(jiān)管內(nèi)容提供了便利,但也對監(jiān)管的時效性、規(guī)范性提出了更高要求。為此,可以考慮從以下兩方面采取措施應(yīng)對挑戰(zhàn)。

        (1)建立分類分級監(jiān)管制度

        分類分級的監(jiān)管模式是當(dāng)前人工智能產(chǎn)業(yè)治理的主流選擇。歐盟的《人工智能法》率先規(guī)定了風(fēng)險分級監(jiān)管制度,將人工智能應(yīng)用劃分為低風(fēng)險、有限風(fēng)險、高風(fēng)險和不可接受風(fēng)險四個等級,并針對不同等級制定相應(yīng)的監(jiān)管要求。我國在《中華人民共和國數(shù)據(jù)安全法》第21條中提出“國家建立數(shù)據(jù)分類分級保護(hù)制度”,也確立了分類分級監(jiān)管原則,但在目前人工智能開發(fā)和使用的實(shí)踐中,具體要求并不明確。為此,應(yīng)從以下兩方面建立更具針對性的分類分級監(jiān)管制度。

        一是要明確數(shù)據(jù)分類分級的標(biāo)準(zhǔn)。例如,可依主體類別劃分為國家數(shù)據(jù)、企業(yè)數(shù)據(jù)、個人數(shù)據(jù);可基于權(quán)益侵害所涉及的領(lǐng)域進(jìn)行分級,大致分為國家安全和公共利益領(lǐng)域數(shù)據(jù)、經(jīng)濟(jì)社會和企業(yè)權(quán)益領(lǐng)域數(shù)據(jù)、個體權(quán)益領(lǐng)域數(shù)據(jù)。[17]二是要根據(jù)數(shù)據(jù)的不同類別與層級,采取相應(yīng)的監(jiān)管措施。當(dāng)人工智能訓(xùn)練數(shù)據(jù)的來源作品關(guān)乎國家安全和社會公共利益時,應(yīng)對其傳播范圍、傳播方式、傳播時段等進(jìn)行嚴(yán)格監(jiān)管和審核;當(dāng)人工智能訓(xùn)練數(shù)據(jù)的來源作品出自個人時,則只需進(jìn)行概括性監(jiān)管,重點(diǎn)核查其傳播是否經(jīng)著作權(quán)人知悉同意、是否得到授權(quán)等,確保不損害著作權(quán)人的合法權(quán)益。鑒于此,人工智能開發(fā)者也應(yīng)設(shè)立專門的數(shù)據(jù)管理人員,對不同類別和層級的作品進(jìn)行技術(shù)保障和管理,以便實(shí)現(xiàn)對作品傳播過程的監(jiān)管,并有利于在發(fā)現(xiàn)侵權(quán)行為時及時采取相應(yīng)的補(bǔ)救措施。

        (2)探索訓(xùn)練數(shù)據(jù)監(jiān)管沙盒制度

        2015年,英國金融行為監(jiān)管局在《監(jiān)管沙盒》(Regulatorysandbox)報告中提出了監(jiān)管沙盒的概念,并于2016年正式啟動。其將監(jiān)管沙盒定義為一個“安全空間”,企業(yè)可以在其中測試新型產(chǎn)品或服務(wù)的性能、損耗,不會因從事相關(guān)活動而立即面臨監(jiān)管后果。目前,歐盟的《人工智能法》引入了這一制度,歐盟成員國如西班牙、法國,非歐盟成員國如新加坡、日本等,都已籌劃或開展人工智能監(jiān)管沙盒的試點(diǎn)工作。就人工智能大模型訓(xùn)練的輸出階段而言,先通過沙盒進(jìn)行作品生成和傳播的模擬,收集其在一定周期內(nèi)的傳播速度和廣度,進(jìn)而分析訓(xùn)練數(shù)據(jù)侵害著作權(quán)的可能性和危害程度,這樣可幫助人工智能開發(fā)者在不完全掌握訓(xùn)練數(shù)據(jù)輸出風(fēng)險的情況下,判斷能否采取傳播行為,從而最大限度避免如《紐約時報》訴OpenAI及微軟案中被告所導(dǎo)致的侵權(quán)行為。

        我國尚未從國家層面對監(jiān)管沙盒作出明確規(guī)定,但也不乏各地“自下而上”的探索實(shí)踐。2024年3月29日,在北京AI原生產(chǎn)業(yè)創(chuàng)新大會暨北京數(shù)據(jù)基礎(chǔ)制度先行區(qū)成果發(fā)布會上,國內(nèi)首個人工智能數(shù)據(jù)訓(xùn)練基地宣布正式啟用,并提出針對大模型訓(xùn)練的數(shù)據(jù)合規(guī)和場景應(yīng)用引入監(jiān)管沙盒機(jī)制,以規(guī)范數(shù)據(jù)所有權(quán)和數(shù)據(jù)安全、約束收益分配行為等。然而要想更好地發(fā)揮監(jiān)管沙盒制度的價值,釋放數(shù)據(jù)資源活力,亟須出臺和完善相關(guān)配套規(guī)范。一方面要明確沙盒責(zé)任主體,加強(qiáng)對沙盒參與者的指導(dǎo),提升監(jiān)管人員自身的能力水平,確保監(jiān)管機(jī)構(gòu)職責(zé)明確、監(jiān)管人員專業(yè)技能過硬。另一方面要加強(qiáng)對監(jiān)管沙盒中的數(shù)據(jù)保護(hù),尤其是要避免對個人信息、隱私權(quán)造成侵害,可以考慮通過技術(shù)手段進(jìn)行信息匿名化處理,或者引導(dǎo)沙盒參與者審慎操作,以規(guī)范、可靠的方式進(jìn)行數(shù)據(jù)利用。[18]

        3.基于包容審慎規(guī)制理念重構(gòu)合理使用制度

        (1)包容審慎的規(guī)制理念

        新興技術(shù)的發(fā)展在促進(jìn)大數(shù)據(jù)模型乃至人工智能產(chǎn)業(yè)轉(zhuǎn)型升級的同時,也對傳統(tǒng)的規(guī)制理念發(fā)起了挑戰(zhàn)。早在2017年國務(wù)院《政府工作報告》中便已提出,本著鼓勵創(chuàng)新、包容審慎的原則,制定新興產(chǎn)業(yè)監(jiān)管規(guī)則,并在后續(xù)《中共中央國務(wù)院關(guān)于新時代加快完善社會主義市場經(jīng)濟(jì)體制的意見》《法治中國建設(shè)規(guī)劃(2020—2025年)》《法治政府建設(shè)實(shí)施綱要(2021—2025年)》等諸多文件中加以強(qiáng)調(diào),確立了對人工智能等新技術(shù)、新業(yè)態(tài)、新模式的包容審慎規(guī)制理念。

        包容原則要求對未知大于已知的新業(yè)態(tài)采取較為寬松的態(tài)度,為新質(zhì)生產(chǎn)力營造良好生長環(huán)境但不得觸碰安全底線;審慎原則要求面對萌芽階段的新業(yè)態(tài),要以寬容的心態(tài)給它一個“觀察期”,但仍要嚴(yán)守安全底線,對侵犯知識產(chǎn)權(quán)等行為采取嚴(yán)厲監(jiān)管措施。[19]具體到著作權(quán)領(lǐng)域,在包容審慎原則下,版權(quán)作品、已合法公開的個人信息、公共數(shù)據(jù)等,都可作為大模型訓(xùn)練的素材,為人工智能產(chǎn)業(yè)發(fā)展提供廣闊的生存空間;與此同時,也要充分保障著作權(quán)人的合法權(quán)益,制定并確立規(guī)制人工智能開發(fā)者行為的規(guī)章制度,杜絕借助技術(shù)措施侵害著作權(quán)人權(quán)益的行為發(fā)生。可見,在包容審慎規(guī)制理念下,對現(xiàn)有制度進(jìn)行重塑顯得尤為必要,是順應(yīng)技術(shù)創(chuàng)新迅猛發(fā)展的呼喚。

        (2)完善合理使用理論和規(guī)范

        合理使用制度對于人工智能產(chǎn)業(yè)的發(fā)展顯得尤為重要。為充分發(fā)揮其在促進(jìn)技術(shù)創(chuàng)新、推動產(chǎn)業(yè)發(fā)展中的積極作用,應(yīng)當(dāng)在包容審慎規(guī)制理念下對合理使用制度進(jìn)行重構(gòu)。這不僅要求學(xué)術(shù)理論不斷突破傳統(tǒng)思維框架,動態(tài)回應(yīng)人工智能技術(shù)復(fù)雜多變的應(yīng)用場景,還要求具體的法律規(guī)范能夠兼顧技術(shù)發(fā)展與社會公共利益之間的平衡。鑒于此,可以從以下三方面著手加以完善。

        首先,對訓(xùn)練數(shù)據(jù)的表達(dá)性使用與非表達(dá)性使用進(jìn)行細(xì)致區(qū)分。前者指的是以閱讀、欣賞或復(fù)制作品內(nèi)容為自的的使用行為,如在閱讀小說、欣賞音樂或復(fù)制文本片段時,使用者直接體驗或獲取作品本身的表達(dá)內(nèi)容的行為;后者是指不以獲取作品內(nèi)容或向公眾傳播作品內(nèi)容為目的的使用行為,如在技術(shù)測試中使用作品作為輸入材料進(jìn)行運(yùn)算處理,或者將作品作為研究數(shù)據(jù)的一部分進(jìn)行分析的行為。通常情況下,非表達(dá)性使用不涉及對作品表達(dá)部分的直接利用,因此不需要獲得著作權(quán)人的許可,亦不會構(gòu)成對著作權(quán)的侵犯。換言之,只有人工智能大模型對作品進(jìn)行表達(dá)性使用時,才會落人著作權(quán)法的保護(hù)范疇,此時合理使用制度才具備適用空間。在實(shí)際情況中,生成式人工智能對作品的使用往往是按照指令處理作品,再依據(jù)用戶目的進(jìn)行分析和結(jié)果呈現(xiàn),并不涉及對作品獨(dú)創(chuàng)性表達(dá)的利用,即以非表達(dá)性使用為主;但表達(dá)性使用的情況亦會存在,例如根據(jù)用戶需求提煉小說核心情節(jié)、依照小說內(nèi)容生成虛擬角色等,且這種情況一旦出現(xiàn),會引發(fā)更激烈的爭議、造成更大的侵權(quán)風(fēng)險。

        其次,借助轉(zhuǎn)化性使用理論判定是否構(gòu)成合理使用。在全國首例人工智能繪畫大模型訓(xùn)練著作權(quán)侵權(quán)案[2]中,原告認(rèn)為,被告將其作品用于訓(xùn)練人工智能大模型并應(yīng)用于商業(yè)領(lǐng)域,此舉擠壓了原告依托作品獲得收益的空間,對原告的權(quán)益如復(fù)制權(quán)、改編權(quán)等造成嚴(yán)重侵害。被告則辯稱其使用作品的目的在于進(jìn)行模型訓(xùn)練,且訓(xùn)練結(jié)果與原作品不存在實(shí)質(zhì)性相似,該行為構(gòu)成合理使用,不會損害原告的潛在市場。在此情形下,便可借助轉(zhuǎn)化性使用理論,判斷人工智能大模型使用作品的行為是否具有較高的轉(zhuǎn)換性和創(chuàng)造性,該過程越能體現(xiàn)新的目的和內(nèi)容,則越容易構(gòu)成合理使用。生成式人工智能使用作品的目的在于找尋特征、總結(jié)規(guī)律,并基于數(shù)據(jù)的學(xué)習(xí)完成指令要求。就內(nèi)容而言,也不是一味裁剪、拼湊或抄襲,而是會根據(jù)其算法邏輯和使用者指令詞進(jìn)行再創(chuàng)作。因此,這種對作品的使用在目的和內(nèi)容上都具有轉(zhuǎn)換性,依據(jù)合理使用制度對這一行為加以保護(hù),符合著作權(quán)法的立法宗旨和精神。

        最后,應(yīng)適時調(diào)整合理使用的法律規(guī)范。我國著作權(quán)法通過窮盡式列舉模式對合理使用的情形做出了嚴(yán)格限制。其中,第24條第

        13項“法律、行政法規(guī)規(guī)定的其他情形”雖然在一定程度上具有兜底和擴(kuò)充合理使用事由的功能,但依然要求事由的法定性,這使得合理使用事由在開放性與靈活性上存在不足。因此,為滿足人工智能大模型的發(fā)展需求,應(yīng)當(dāng)適當(dāng)擴(kuò)展合理使用的事由范圍。在立法層面,目前可以分兩步推進(jìn):短期內(nèi),可對《中華人民共和國著作權(quán)法實(shí)施條例》進(jìn)行修改,增加“數(shù)據(jù)挖掘”“為數(shù)據(jù)訓(xùn)練的目的”等類似表述,將其作為合理使用的特定情形;待實(shí)踐檢驗并收集反饋意見后,再決定是否有必要對著作權(quán)法第24條加以調(diào)整,并探索如何完善配套規(guī)范。此外,相關(guān)規(guī)范還應(yīng)進(jìn)一步明確人工智能開發(fā)者的注意義務(wù),從而為判斷“不合理地?fù)p害權(quán)利人的合法權(quán)益”提供依據(jù)。在互聯(lián)網(wǎng)治理中,以避風(fēng)港規(guī)則為框架設(shè)定了網(wǎng)絡(luò)服務(wù)提供者的注意義務(wù),這種治理方案為平衡人工智能開發(fā)者與著作權(quán)人利益、保障著作權(quán)合理使用的正當(dāng)性提供了經(jīng)驗借鑒,[2]因此在調(diào)整合理使用法律規(guī)范時應(yīng)當(dāng)注意和其他條款、規(guī)范之間的銜接與協(xié)調(diào)。

        五、結(jié)語

        人工智能技術(shù)如雨后春筍般涌現(xiàn)并持續(xù)演變,不可避免會給知識產(chǎn)權(quán)制度帶來挑戰(zhàn)。在世界范圍內(nèi),訓(xùn)練數(shù)據(jù)在不同階段所引發(fā)的著作權(quán)侵權(quán)風(fēng)險時有發(fā)生,許可使用制度在海量數(shù)據(jù)面前的不適應(yīng)性日益凸顯,盡管現(xiàn)行的合理使用制度在司法實(shí)踐中占據(jù)主流,但仍有亟待調(diào)整之處。技術(shù)應(yīng)當(dāng)具有普惠性,在推動新興產(chǎn)業(yè)經(jīng)濟(jì)革新的同時,也要給著作權(quán)人帶來紅利。在包容審慎的規(guī)制理念下,對著作權(quán)法有關(guān)制度加以完善補(bǔ)充,同時從生成式人工智能訓(xùn)練數(shù)據(jù)的各個階段入手,對不同的風(fēng)險形態(tài)進(jìn)行預(yù)防規(guī)制,既是適應(yīng)生產(chǎn)力和生產(chǎn)方式變革的要求,也是加強(qiáng)人工智能產(chǎn)業(yè)國際競爭力、提升我國法律規(guī)則和治理理念話語權(quán)的體現(xiàn)。

        參考文獻(xiàn)

        [1]刁云蕓.涉互聯(lián)網(wǎng)平臺作品數(shù)據(jù)集合的反不正當(dāng)競爭法保護(hù)[J].中國出版,2021(9):24-28.

        [2]李婷.生成式AI數(shù)據(jù)訓(xùn)練的合理使用規(guī)則研究[J]傳播與版權(quán),2024(15):94-100.

        [3]紐約時報起訴要求銷毀ChatGPT,賠償數(shù)十億美元[EB/OL]. (2024-01-04)[2024-10-20].https://mp.weixin.qq.com/s/Vir_jOJcW947-7hZSUlAFg.

        [4]焦和平.人工智能創(chuàng)作中數(shù)據(jù)獲取與利用的著作權(quán)風(fēng)險及化解路徑[J].當(dāng)代法學(xué),2022,36(4):128-140.

        [5]張濤.生成式人工智能訓(xùn)練數(shù)據(jù)集的法律風(fēng)險與包容審慎規(guī)制[J].比較法研究,2024(4):86-103.

        [6]徐聰穎.群體傳播視域下我國文字作品著作權(quán)集體管理的制度反思[J].出版發(fā)行研究,2024(6):78-82.

        [7]王國柱.著作權(quán)“選擇退出”默示許可的制度解析與立法構(gòu)造[J].當(dāng)代法學(xué),2015,29(3):106-112.

        [8]李楊.著作權(quán)合理使用制度的體系構(gòu)造與司法互動[J].法學(xué)評論,2020,38(4):88-97.

        [9]譚偉.生成式AI著作權(quán)侵權(quán)風(fēng)險化解路徑探究[J]傳播與版權(quán),2024(14):107-110.

        [10]張金平.人工智能作品合理使用困境及其解決[J].環(huán)球法律評論,2019,41(3):120-132.

        [11]AI訓(xùn)練數(shù)據(jù)不用擔(dān)心版權(quán)問題?日本政府表態(tài)引發(fā)熱議[EB/OL]. (2023-06-02)[2024-10-22].https://new.qq.com/rain/a/20230602A09RL000.

        [12]金海軍.合理使用認(rèn)定中“轉(zhuǎn)換性使用”的重新界定——基于“戈德史密斯案”的思考[J].中國版權(quán),2024(2): 36-50.

        [13]陶乾.基礎(chǔ)模型訓(xùn)練的著作權(quán)問題:理論澄清與規(guī)則適用[J].政法論壇,2024,42(5):152-164.

        [14]袁帥.數(shù)字化背景下作品非表達(dá)性使用的著作權(quán)法應(yīng)對[J].知識產(chǎn)權(quán),2024(9):110-126.

        [15]馮愷.個人信息“選擇退出”機(jī)制的檢視和反思[J].環(huán)球法律評論,2020,42(4):148-165.

        [16]孫清白.論人工智能大模型訓(xùn)練數(shù)據(jù)風(fēng)險治理的規(guī)范構(gòu)建[J].電子政務(wù),2024(12):41-52.

        [17]王海洋.生成式AI訓(xùn)練數(shù)據(jù)的法律風(fēng)險及其元規(guī)制[J].浙江社會科學(xué),2024(9):50-63,157-158.

        [18]張廣偉.歐盟人工智能監(jiān)管沙盒制度的功能、局限及其啟示——基于歐盟《人工智能法》的解析[J].德國研究,2024,39(2):116-132,136.

        [19]逯達(dá).文生視頻類人工智能的數(shù)據(jù)風(fēng)險及其法律規(guī)制-以Sora為例[J].河南社會科學(xué),2024,32(10):77-87.

        [20]北京互聯(lián)網(wǎng)法院開庭審理全國首例涉及AI繪畫大模型訓(xùn)練著作權(quán)侵權(quán)案[EB/OL].(2024-06-20)[2024-10-31]. https://mp.weixin.qq.com/s/cyskAz1cASBaNIYQp-GpGsA.

        [21]徐小奔.技術(shù)中立視角下人工智能模型訓(xùn)練的著作權(quán)合理使用[J].法學(xué)評論,2024,42(4):86-99.

        Risk and Countermeasures of Copyright Infringement in Generative Artificial Intelligence Training Data

        JIN Yufei

        Abstract:

        The trainingand use of data by generative artificial intelligence pose significant challenges to the traditional copyright system, and there are constant conflicts of interest between data property owners and data users.By analyzing the various stages of datatraining in generative artificial intelligence,it canbe found thatthe existing risk regulation paths represented by licensed use and fair use are not adaptable in the era of artificial intelligence. This article explores thecopyright infringement risks at various stages of generative artificial inteligence training, and proposes targeted strategiesand suggestions for improving thefair use system,inorder toachieveabalance of interests between the innovation in the artificial intelligence industry and copyright protection. Theresearch process is mainly divided into three parts: through literature review and case analysis,clarify the prerequisites for data infringement in generative artificial intelligence training and the risk paterns at each stage; reviewand reflect on the current situation ofcopyright infringementregulations for generativeartificial intellience trainingdata; propose a regulatory approach for copyright infringement risks of generative artificial inteligence training data based on existing regulatory models,and respond to infringement risks at various stages.

        Research has found that the prerequisite for generating artificial intellgence training data to trigger copyright infringement risks is that the data meet the requirements for the composition of copyright works.The pattrns of infringement risks at different stages of training are as folows: the infringement risks at the input stage are mainly manifested as infringement of reproduction rights; the infringement risks at the utilization stage mainly manifest as infringement of the rightsof adaptation,compilation,and translation; the infringement risks at theoutput stage mainlymanifest as infringement ofbroadcasting rights and information network disemination rights.Based on the analysis oftheexisting infringement regulation paths,itis believed that the relevant provisions on license use have limited applicabilityand lack operability in practice;the legislative models of \"rule-based\"and \"factorist\"under reasonable use are also incompatible with the development of generative artificial intelligence in different degrees, lacking clear norms or unified standards.

        Based on the analysis,the article proposes a regulatory approach for the risks of copyright infringement in generative artificial inteligence training data: at the input stage,by standardizing datacolection methodsand improving disclosure standards for training data copyright information,the source of training data can be ensured to be legal; a classification and grading supervision system at the output stage is established, a sandbox system for training data supervision is explored,andthe supervision of the outputcontentofartificialintelligence large models is strengthened; based on the concept of inclusive and prudent regulation,the theory and norms of fair use are improved,and the system of fair use is reconstructed.

        Keywords: generative artificial intelligence; training data; copyright; reasonable use

        Author Afiliation: School ofLaw, Shandong University 收稿日期:2025-01-04修回日期:2025-04-07

        延伸閱讀:國家網(wǎng)信辦等七部門聯(lián)合公布《生成式人工智能服務(wù)管理暫行辦法》

        國家網(wǎng)信辦聯(lián)合國家發(fā)展改革委、教育部、科技部、工業(yè)和信息化部、公安部、廣電總局公布《生成式人工智能服務(wù)管理暫行辦法》(簡稱《辦法》),自2023年8月15日起施行。國家互聯(lián)網(wǎng)信息辦公室有關(guān)負(fù)責(zé)人表示,出臺《辦法》,旨在促進(jìn)生成式人工智能健康發(fā)展和規(guī)范應(yīng)用,維護(hù)國家安全和社會公共利益,保護(hù)公民、法人和其他組織的合法權(quán)益。

        近年來,生成式人工智能技術(shù)快速發(fā)展,在為經(jīng)濟(jì)社會發(fā)展帶來新機(jī)遇的同時,也引發(fā)了傳播虛假信息、侵害個人信息權(quán)益、數(shù)據(jù)安全和偏見歧視等問題。出臺《辦法》,既是促進(jìn)生成式人工智能健康發(fā)展的重要要求,也是防范生成式人工智能服務(wù)風(fēng)險的現(xiàn)實(shí)需要。

        《辦法》提出國家堅持發(fā)展和安全并重、促進(jìn)創(chuàng)新和依法治理相結(jié)合的原則,采取有效措施鼓勵生成式人工智能創(chuàng)新發(fā)展,對生成式人工智能服務(wù)實(shí)行包容審慎和分類分級監(jiān)管,明確了提供和使用生成式人工智能服務(wù)總體要求。提出了促進(jìn)生成式人工智能技術(shù)發(fā)展的具體措施,明確了訓(xùn)練數(shù)據(jù)處理活動和數(shù)據(jù)標(biāo)注等要求。規(guī)定了生成式人工智能服務(wù)規(guī)范,明確生成式人工智能服務(wù)提供者應(yīng)當(dāng)采取有效措施防范未成年人用戶過度依賴或者沉迷生成式人工智能服務(wù),按照《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》對圖片、視頻等生成內(nèi)容進(jìn)行標(biāo)識,發(fā)現(xiàn)違法內(nèi)容應(yīng)當(dāng)及時采取處置措施等。此外,還規(guī)定了安全評估、算法備案等制度,明確了法律責(zé)任。

        猜你喜歡
        著作權(quán)人許可人工智能
        人工智能生成物的著作權(quán)侵權(quán)問題探析
        獨(dú)立型外掛侵犯修改權(quán)的探討
        不確定性環(huán)境下專利開放許可激勵策略演化分析
        采礦許可證到期后繼續(xù)開采行為的刑法定性
        數(shù)據(jù)強(qiáng)制許可制度的構(gòu)建
        美國數(shù)字音樂版權(quán)授權(quán)模式分析
        傳媒(2025年13期)2025-08-03 00:00:00
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        下一幕,人工智能!
        99久久国产精品网站| 免费无遮挡毛片中文字幕| 精品一区二区三区不老少妇| 性生大片免费观看性少妇| 国内最真实的xxxx人伦| 小12箩利洗澡无码视频网站| 中文字幕久久精品波多野结百度 | 国色天香中文字幕在线视频| 毛片24种姿势无遮无拦| 色综合久久加勒比高清88| av是男人的天堂免费| 人人妻人人澡人人爽欧美一区 | 天天摸天天做天天爽天天舒服| 国产日产亚洲系列首页| 激情综合色五月丁香六月欧美| 亚洲中久无码永久在线观看同 | 漂亮人妻被黑人久久精品| 亚洲AV手机专区久久精品| 网站在线观看视频一区二区 | 美女脱了内裤洗澡视频| 欧美狠狠入鲁的视频777色| AV无码最在线播放| 放荡人妻一区二区三区| 蜜桃a人妻精品一区二区三区| 久久久老熟女一区二区三区 | 国产毛女同一区二区三区| 中文字幕乱码熟女人妻水蜜桃 | 蜜桃av多人一区二区三区| 人妻少妇精品专区性色anvn| 少妇av射精精品蜜桃专区| 成人xx免费无码| 国产一区二区三区在线观看黄| 久久久久亚洲av综合波多野结衣| 亚洲国产成人久久一区www | 日韩一线无码av毛片免费| 日韩精品一区二区三区四区视频| 我要看免费久久99片黄色| 麻豆精品久久久久久久99蜜桃| 亚洲深夜福利| 你懂的视频网站亚洲视频| 777国产偷窥盗摄精品品在线|