亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        機器學習使用作品的著作權(quán)風險與化解的法律路徑

        2023-04-17 16:24:06
        南海法學 2023年6期

        陳 諾 楊 興

        (中國人民大學 法學院,北京 100872;廣東金融學院 法學院,廣東 廣州 510521)

        一、機器學習使用作品的著作權(quán)風險分析

        在機器學習中,傳統(tǒng)的預先規(guī)劃操作流程被一種自主學習的機制替代,使得機器能夠從數(shù)據(jù)中自主學習和提取模式、規(guī)律和知識。與傳統(tǒng)的計算機學習不同,機器學習更加靈活和自主,不再需要人工干預來確定學習對象和特征,而是通過算法進行自動的特征選擇和模型構(gòu)建。①孫陽:《人工智能的合理使用之辯》,《海峽法學》2018年第3期。機器學習也具備自我完善和優(yōu)化的機制,通過不斷與環(huán)境進行交互和反饋,機器能夠根據(jù)反饋信息自主調(diào)整和改進自身的學習算法和模型,以適應(yīng)不斷變化的需求和環(huán)境。這種自我完善機制使得機器學習具備了持續(xù)學習和不斷演化的能力,能夠更好地適應(yīng)復雜和多變的任務(wù)和環(huán)境。②Sean Semmler and Zeeve Rose,“Artificial Intelligence,Application Today and Implications Tomorrow”,Duke Law& Technology Review,(2017):85.

        機器學習概念涵蓋廣泛,學界、業(yè)界對其定義也不甚相同,本文所探討的機器學習是指推進機器智能化活動的關(guān)鍵支撐技術(shù),它從海量的數(shù)據(jù)中獲取新的知識或技能,同時完善自身功能。機器學習的過程包括廣泛地收集訓練數(shù)據(jù),而后又通過“電子復制”的方式將它們輸入計算機系統(tǒng)中形成訓練數(shù)據(jù)集,以便于對它們展開分析以及結(jié)果生成。近些年,人臉識別、語音識別、購物推薦、文本生成、健康醫(yī)療等領(lǐng)域背后無不是機器學習技術(shù)快速發(fā)展的身影。

        與人類學習類似,機器學習也面臨學習材料以及學習資源的問題。模型的建立,還有進一步的算法優(yōu)化都需要大量的作品作為訓練資源,而這些資料中往往包括受著作權(quán)法保護的作品,包括文學、攝影、影視、美術(shù)、音樂以及計算機軟件等作品。如全球知名圖片提供商Getty Images 起訴熱門人工智能繪畫工具Stable Diffusion 的開發(fā)者Stability AI。Getty Images 聲稱Stability AI 未經(jīng)“許可”以及提供“補償”,復制了Getty Images數(shù)十億個文本和圖像用以訓練模型,并對其進行編碼和解碼,侵犯其復制權(quán)。并且Stability AI 在未經(jīng)Getty Images 授權(quán)的情況下復制Getty Images 的版權(quán)作品創(chuàng)作衍生作品,侵犯了美國著作權(quán)法①美國著作權(quán)法第106 節(jié)內(nèi)容規(guī)定了作者所享有的5 項權(quán)利,即復制權(quán)(right to reproduce)、發(fā)行權(quán)(right to distribute)、演繹權(quán)(right to prepare derivative works)、公開表演權(quán)(right to publicly perform)和展示權(quán)(right to display)。下作者的復制權(quán)、發(fā)行權(quán)、演繹權(quán)等權(quán)利。此外,還有三位藝術(shù)家對綜合藝術(shù)平臺DEVIANT ART 提起了訴訟。在起訴書中,原告認為被告在可以獲得但沒有獲得原告的許可下,用原告的圖像訓練人工智能或其他計算機程序、算法或其他功能預測引擎并創(chuàng)建基于該作品的衍生作品,侵犯了原告的復制、發(fā)行、傳播等權(quán)利。②Getty Images 訴Stable Diffusion 起訴狀,https://stablediffusionlitigation.com/pdf/00201/1-1-stable-diffusion-complaint.pdf,最后訪問時間:2023年11月11日。

        目前在數(shù)據(jù)輸入活動中常見的收集作品的方式為,通過“爬蟲協(xié)議”爬取網(wǎng)站數(shù)據(jù),未經(jīng)許可抓取數(shù)據(jù)庫數(shù)據(jù),或者未經(jīng)許可將作品數(shù)字化并形成數(shù)據(jù)集③劉友華、魏遠山:《機器學習的著作權(quán)侵權(quán)問題及其解決》,《華東政法大學學報》2019年第2期。,在此過程中,可能涉及侵犯作品的復制權(quán),因為作品需要被收集和分析。這些收集的活動往往涉及著作權(quán)人的“復制權(quán)”,同時在2020年的我國著作權(quán)法修改中,復制權(quán)中引入了“數(shù)字化”方式,導致了更多的作品收集行為可能被納入復制權(quán)的范疇。其次,在作品收集之后,需要對作品進行加工、整理、匯編等操作。如果這些操作的結(jié)果構(gòu)成著作權(quán)法意義上的新作品,可能涉及侵犯改編權(quán)和匯編權(quán)。此外,如果需要將文字作品翻譯成不同的語言,可能涉及翻譯權(quán)的問題。最后,在生成與提供最后結(jié)果階段,公司需要通過互聯(lián)網(wǎng)傳輸數(shù)據(jù)或改編后的作品,或者將其上傳到云端。從著作權(quán)法的角度來看,這可能涉及侵犯向公眾傳播權(quán),包括信息網(wǎng)絡(luò)傳播權(quán)和廣播權(quán)。總而言之,機器學習會無可避免地對數(shù)據(jù)進行拷貝、翻譯、篡改、重新編寫等行為,可能涉及著作權(quán)人的復制、發(fā)行、演繹等權(quán)利,抑或是構(gòu)成了《中華人民共和國著作權(quán)法》第五十二、五十三條所規(guī)定的侵權(quán)行為,由此引發(fā)侵權(quán)爭議。

        著作權(quán)法旨在鼓勵文學創(chuàng)作和傳承,給予著作權(quán)人相當程度的專有權(quán)以鼓勵創(chuàng)作。而著作權(quán)人獲得的專有權(quán)和機器學習具有相當程度的矛盾沖突。分析既有研究成果,可以發(fā)現(xiàn)當前對于機器學習與著作權(quán)合理使用制度的討論存在兩個方面的問題。第一,對于機器學習使用作品的特點有所忽略,從而造成評價機器學習與保護著作權(quán)人權(quán)利沖突之間存在較大區(qū)別。第二,對于如何將機器學習中對作品的使用納入現(xiàn)行著作權(quán)法之中,是法定許可還是合理使用制度存在爭議。基于前述問題,本文希望借助機器學習使用作品的特點說明為何需要將其納入著作權(quán)限制與例外。同時本文將討論“法定許可”與“合理使用”的制度選擇不同,希望對保護著作權(quán)人的權(quán)利和促進機器學習技術(shù)發(fā)展間的利益平衡有所助益。

        二、產(chǎn)生風險的原因

        首先需要明確的是,應(yīng)當對機器學習使用作品這一行為進行法律上的規(guī)制與處理,并且需要為機器學習創(chuàng)設(shè)著作權(quán)的限制與例外。目前機器學習與著作權(quán)的沖突體現(xiàn)在實踐中是著作權(quán)人與機器學習公司的矛盾,體現(xiàn)在法律上是著作權(quán)人的權(quán)利保護與促進技術(shù)發(fā)展的矛盾。相對于人類有限的認知能力,機器學習的能力是無限的。程序可以不斷地自我設(shè)定目標,實現(xiàn)成長進化,于是機器通過學習具備了超越設(shè)計者本人的智能,也具備了在各個領(lǐng)域戰(zhàn)勝人類的實力。其不但可以識別人臉、文字、語音、場景,還可以理解語義、自主創(chuàng)作。但我國現(xiàn)行的著作權(quán)法卻更偏向于嚴格保護作品,并規(guī)定了版權(quán)使用者都需要為使用作品征得授權(quán)人的許可并支付報酬,否則作品就會陷入侵權(quán)的狀況。然而機器學習技術(shù)的研發(fā)者則需要有大量的訓練數(shù)據(jù),按照目前我國著作權(quán)法的規(guī)定,研發(fā)人員如果使用受著作權(quán)法保護的作品,需要在獲取訓練數(shù)據(jù)前征得著作權(quán)人許可。而如果研究公司未獲得授權(quán)或未提供報酬,依現(xiàn)行的司法規(guī)定,作品權(quán)利人可以向機器學習研發(fā)公司提起法律索賠,雖然每部作品的索賠費用不一定都非常高昂,但這樣龐大的作品基數(shù)所產(chǎn)生的天價索賠也并非普通公司所能承擔的,更別提由此而產(chǎn)生的巨大司法成本和社會成本。

        所以,現(xiàn)有知識產(chǎn)權(quán)法律體系有必要作出回應(yīng),以調(diào)適科技發(fā)展與著作權(quán)保護的矛盾,應(yīng)對新型科技挑戰(zhàn),平衡各方權(quán)益。接下來,本文將主要從機器學習特點三個方面,即低密度化、創(chuàng)造性強、算法偏見,考察論證應(yīng)當為機器學習創(chuàng)設(shè)著作權(quán)的限制與例外。

        (一)低密度化

        機器學習利用作品的方式多種多樣,具體取決于應(yīng)用場景和任務(wù)要求。機器學習可以利用已有的作品數(shù)據(jù)來訓練模型,從而對未知的作品進行分類或預測。例如,根據(jù)文本內(nèi)容進行情感分析,對音頻數(shù)據(jù)進行語音識別,對圖像進行目標分類等。這種能力讓機器學習能夠在大規(guī)模作品數(shù)據(jù)中發(fā)現(xiàn)模式和趨勢,從而進行準確的分類和預測。同時機器學習可以從大量作品中提取有用的信息和摘要。通過對作品數(shù)據(jù)的分析和模擬,機器學習可以自動提取關(guān)鍵詞、主題、摘要或總結(jié),從而幫助用戶快速了解和瀏覽大規(guī)模的作品內(nèi)容。機器學習也可以利用作品數(shù)據(jù)來評估模型的性能,并進行優(yōu)化和改進。通過對已有作品的分析和比較,機器學習可以衡量模型的準確性、效率和創(chuàng)造性等指標,并幫助優(yōu)化模型的表現(xiàn)??偟膩碚f,機器學習通過對作品數(shù)據(jù)的學習和分析,可以進行分類、預測、生成、提取、總結(jié)、評估和改進等多種操作,從而實現(xiàn)對作品的利用和增值。

        但在機器學習中,數(shù)據(jù)的規(guī)模和多樣性對于取得良好的模型性能至關(guān)重要。對于機器學習公司而言,單個數(shù)據(jù)對其收益的貢獻微乎其微,只有通過收集大量作品數(shù)據(jù)并進行大規(guī)模的分析和運算,機器學習技術(shù)才能發(fā)揮其真正的作用。這種低密度化的特點要求機器學習公司采取全面的數(shù)據(jù)收集策略,包括數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)標注等環(huán)節(jié)。數(shù)據(jù)收集的過程可能涉及與不同數(shù)據(jù)來源的協(xié)商和合作,以確保數(shù)據(jù)的完整性和質(zhì)量。同時,數(shù)據(jù)的規(guī)模也直接影響到機器學習算法的復雜性和模型訓練的時間成本。較大規(guī)模的數(shù)據(jù)集可以提供更全面的樣本分布,以及更豐富的模式和特征信息,從而可以訓練出更準確的模型。除了數(shù)據(jù)規(guī)模,數(shù)據(jù)的多樣性也對機器學習的效果和創(chuàng)造力產(chǎn)生重要影響。多樣化的數(shù)據(jù)可以幫助機器學習模型更好地適應(yīng)不同場景和樣本,提升泛能力和創(chuàng)造潛力。只有通過收集和運用海量作品,機器學習技術(shù)才能實現(xiàn)其真正的潛力。

        (二)創(chuàng)造性強

        著作權(quán)法的主要目的是保護原創(chuàng)作品的創(chuàng)作者并鼓勵他們進行創(chuàng)作。它賦予作品的創(chuàng)作者一定的權(quán)利,例如復制、分發(fā)、展示和修改作品的權(quán)利。這些權(quán)利在一定程度上鼓勵了創(chuàng)作者進行創(chuàng)新和創(chuàng)造性的表達。機器學習作為一種創(chuàng)作工具或輔助工具,可以通過分析和處理大量數(shù)據(jù)生成新的作品,從這個角度來說,機器學習與著作權(quán)法的目的是一致的,都是為了鼓勵創(chuàng)作。

        同時,創(chuàng)造活動是一種推陳出新的歷史過程,新的創(chuàng)作活動往往受益于前人的啟迪。到了今天,學習主體發(fā)生了變化,但不可辯爭的是,機器學習的能力也是人類智慧發(fā)展的延續(xù)和輔助。近些年來機器學習所呈現(xiàn)出的巨大潛力超乎想象,其不僅可以在分析輸入作品的基礎(chǔ)之上進行創(chuàng)作,也可以超越人類的智慧,發(fā)現(xiàn)作品的規(guī)律并進行創(chuàng)作。如果說監(jiān)督學習下的機器學習是在人的智能引導下進行模型的訓練,無監(jiān)督學習下的機器學習則是在去除分類、標簽的要求后,就能夠直接根據(jù)所標注的數(shù)據(jù)進行訓練,進而自主地確定在數(shù)據(jù)集中出現(xiàn)的規(guī)則,與人進行創(chuàng)作無異。機器本身也成為創(chuàng)作的主體,成為輔助人類創(chuàng)作的重要工具,這與著作權(quán)法鼓勵創(chuàng)新創(chuàng)作的目的也一致,同時也就要求法律為其提供相應(yīng)的保障。

        (三)算法偏見

        機器學習算法通常通過大量的數(shù)據(jù)進行訓練,以學習數(shù)據(jù)中的模式和規(guī)律。然而,如果訓練數(shù)據(jù)本身具有偏見或不完整,那么算法生成的結(jié)果也可能具有相應(yīng)的偏見。例如,一個以男性為主的訓練數(shù)據(jù)集可能會導致算法在生成結(jié)果時偏向于男性的觀點和偏好,而忽略女性的需求和權(quán)益。同時如果數(shù)據(jù)采樣方式不具有代表性,或者存在一些系統(tǒng)性的偏差,那么算法在訓練過程中可能會受到這些偏見的影響。例如,在音樂創(chuàng)作領(lǐng)域,如果數(shù)據(jù)采樣傾向于某一地區(qū)的音樂,那么音樂風格便會受到限制。

        機器學習技術(shù)目前面臨的一大瓶頸便是數(shù)據(jù)的質(zhì)量不高以及如何解決算法偏見的問題。如果訓練數(shù)據(jù)不充分或者帶有偏見,那么機器學習會加劇這種片面所帶來的問題。由此可見,數(shù)據(jù)質(zhì)量的好壞直接關(guān)系人工智能作品的好壞。正如前文已述,在獲取優(yōu)秀作品數(shù)據(jù)集方面,著作權(quán)制度的限制可能導致幾個問題。首先,由于著作權(quán)保護,許多優(yōu)秀的作品可能無法被自由獲取和使用,這使得構(gòu)建全面、豐富的數(shù)據(jù)集變得困難。其次,由于數(shù)據(jù)集的構(gòu)建往往需要多個作品的整合,涉及多個著作權(quán)人的許可和合作,這也加大了收集作品的復雜度和法律風險。進而使得人工智能開發(fā)者必須采用“法律限制較少但帶有偏見的數(shù)據(jù)集”來訓練,這也是造成作者計算結(jié)果具有偏見的主要原因。①Amanda Levendowski,“How Copyright Law Can Fix‘Artificial Intelligence’s Implicit Bias Problem,”Washington Law Review,(2018):589.所以高質(zhì)量的訓練數(shù)據(jù)集可以很大程度影響機器學習的效果,減少算法偏見。

        三、化解的法律路徑

        隨著新技術(shù)的發(fā)展,機器學習涉及的流程可能越來越復雜,牽涉的行為也越來越多,傳統(tǒng)的單項行為進一步復雜化,成為具有更多流程的行為。在數(shù)據(jù)輸入、創(chuàng)建數(shù)據(jù)集以及訓練數(shù)據(jù)的過程中,涉及的第三方著作權(quán)也會增多。從上述討論中,我們可以看到,為機器學習創(chuàng)設(shè)著作權(quán)的例外是機器學習特點所決定的,接下來我們應(yīng)當討論如何設(shè)計該項著作權(quán)的例外。

        在現(xiàn)代社會中,因為存在著著作權(quán)約束與反約束等現(xiàn)象,以及存在著創(chuàng)作者、使用者雙方在行使權(quán)利中一定的程序沖突,為促進文學藝術(shù)事業(yè)發(fā)展、保障作者及其他主體權(quán)利、促進社會公平,就必須統(tǒng)籌兼顧,平衡并協(xié)調(diào)一切可能彼此沖突的因素。通過比較不同的機器學習使用作品集的風險化解路徑,我們才能夠推動機器學習技術(shù)的進展,并使之對著作權(quán)人的影響減至最低。

        (一)法定許可與合理使用

        現(xiàn)行著作權(quán)法框架下,有三種使用尚在保護期內(nèi)的作品的合法途徑,包括授權(quán)許可、法定許可與合理使用。針對這三種制度,為應(yīng)對機器學習使用作品的需求,學者們有不同的選擇取向,并且每位學者對一種制度所能涵蓋的機器學習具體范圍給出了自己的定義。有學者認為機器學習去收集分散的權(quán)利成本過于高昂,因此應(yīng)當允許機器學習援引著作權(quán)合理使用制度。有學者僅僅支持將為科學研究目的而進行的文本與數(shù)據(jù)挖掘的機器學習行為納入合理使用制度。①張惠彬、肖啟賢:《人工智能時代文本與數(shù)據(jù)挖掘的版權(quán)豁免規(guī)則建構(gòu)》,《科技與法律(中英文)》2021 年第6期。有學者主張借鑒美國版權(quán)法體系下靈活、開放的合理使用制度②林秀芹:《人工智能時代著作權(quán)合理使用制度的重塑》,《法學研究》2021年第6期。,以應(yīng)對未來可能出現(xiàn)的新技術(shù),根據(jù)個案判斷是否構(gòu)成合理使用。宣喆提議,在不排斥商業(yè)化合理使用目的基礎(chǔ)上,開展對人工智能創(chuàng)意知識產(chǎn)權(quán)領(lǐng)域內(nèi)合理使用的制度構(gòu)建。③宣喆:《論分類保護視角下人工智能創(chuàng)作的著作權(quán)合理使用》,《出版發(fā)行研究》2022年第3期。另一部分學者從最大程度保護著作權(quán)人的角度提出應(yīng)當用“法定許可制度”滿足機器學習使用作品的需要。即機器學習系統(tǒng)沒有產(chǎn)生新的版權(quán)作品,只是用了數(shù)據(jù)集來訓練技術(shù),不夠具有轉(zhuǎn)化性。并且機器學習的過程中復制了作品,因而侵犯了著作權(quán)人的專有權(quán),對于版權(quán)作品的復制不能認為構(gòu)成著作權(quán)合理使用制度,應(yīng)當采取“法定許可”的解決之道④高陽、胡丹陽:《機器學習對著作權(quán)合理使用制度的挑戰(zhàn)與應(yīng)對》,《電子知識產(chǎn)權(quán)》2020年第10期。。此外,也有意見認為通過成品征收補償金制度可以解決機器學習與作品保護制度之間的矛盾問題。⑤高陽、胡丹陽:《機器學習對著作權(quán)合理使用制度的挑戰(zhàn)與應(yīng)對》,《電子知識產(chǎn)權(quán)》2020年第10期??梢钥偨Y(jié)得出:部分學者認為機器學習的過程侵犯了著作權(quán)人專有權(quán),應(yīng)當通過法定許可制度保護著作權(quán)人的利益;部分學者認為把機器學習納入合理使用制度將幫助技術(shù)自由發(fā)展,同時也滿足著作權(quán)法中鼓勵創(chuàng)新的目的。而由于機器學習使用作品的低密度化以及部分作品無權(quán)利主體等特點,授權(quán)許可無法實現(xiàn)。

        筆者認為,從制度角度來看,法定許可與合理使用通常都被視為對著作權(quán)的限制。其區(qū)別可總結(jié)為,合理使用既無須征求著作權(quán)人同意,也無須支付著作權(quán)人相應(yīng)報酬,而法定許可使用則雖無須征求著作權(quán)人同意,但需要支付著作權(quán)人相應(yīng)報酬。所以接下來本文將討論機器學習對著作權(quán)人產(chǎn)生的影響以及是否需要對著作權(quán)人進行補償,從而確定選擇合理使用制度還是法定許可制度。

        機器學習能夠運用的領(lǐng)域包括如音樂生成、文本生成、圖像生成這些容易引起著作權(quán)人反感的表達型領(lǐng)域,以及在圖像識別、論文查重、代碼錯誤識別等非表達型領(lǐng)域。目前已有的討論大多為非表達型的機器學習做出了肯定的答案,即構(gòu)成轉(zhuǎn)換性的合理使用,但對于表達型領(lǐng)域的機器學習,還暫時沒有定論。接下來本文將主要針對表達型領(lǐng)域的機器學習對著作權(quán)人的影響進行深入討論。

        過去的文獻認為表達型的機器學習使用作品將無需經(jīng)過版權(quán)人的授權(quán),也無需向版權(quán)人付費,將使得版權(quán)人無法控制對自己作品的使用。機器學習基于原作品獨創(chuàng)性表達生成的新創(chuàng)作物有可能取代原作品,侵占原作品版權(quán)人的市場,對著作權(quán)人造成負面影響。在判斷是否會對著作權(quán)人產(chǎn)生影響時,中國部分法院曾嘗試在維持合理使用制度必要限度的前提下,對著作權(quán)侵權(quán)糾紛中合理使用的抗辯理由進行適當?shù)膹椥哉J定,適當考慮利用行為的目的、所利用部分與整體在數(shù)量上的比例、被利用作品的性質(zhì)、對潛在市場的影響等要素。這主要借鑒了美國的四要素檢測法,本文也將重點考察機器學習利用行為的目的以及被告對潛在市場的影響以及機器學習特點,并將考察結(jié)果用于分析表達型機器學習對于著作權(quán)人的影響以及是否應(yīng)當對著作權(quán)人進行補償。

        首先是機器學習利用行為的目的。有學者認為商業(yè)目的有時會弱化合理使用的色彩,但鑒于商業(yè)機構(gòu)所能真正承擔相關(guān)數(shù)據(jù)挖掘成本的強大實力,和目前科研機構(gòu)與商業(yè)機構(gòu)合作開發(fā)的趨勢,商業(yè)目的在評定合理使用目的的正當與否所持比重較小。是否是具有生產(chǎn)性或者不同于原來的使用目的和方式、是否提供額外價值,才是用來評價機器學習使用目的正當更為重要的標準。美國法院認為,判斷某種情況是否構(gòu)成合理使用的一個標準是:是否構(gòu)成轉(zhuǎn)換性使用。在此種情況下,合理使用的其他要素考慮占比將會降低。這種轉(zhuǎn)換性體現(xiàn)在新創(chuàng)作的作品是否在原作品的基礎(chǔ)上,以具有創(chuàng)造性的或者不同的特征來優(yōu)化原作品的表達、內(nèi)容和信息。在我國司法實踐中,也存在借鑒創(chuàng)新性轉(zhuǎn)化來判斷合理使用行為。在王某與北京谷某信息技術(shù)有限公司案中,法院認為被告通過片段的方式展現(xiàn)圖書,是為了提供相關(guān)圖書檢索服務(wù)以及便利用戶。該種服務(wù)區(qū)別于平時的服務(wù),是一種轉(zhuǎn)換性的使用,因而不構(gòu)成侵權(quán)。由此可見,轉(zhuǎn)換性規(guī)則的運用,可以解決商業(yè)性使用作品的行為能否構(gòu)成合理使用之難題。以Chatgpt 為例,在訓練其系統(tǒng)時,作品的中間復制是“非表達性的”。最終過程的目的是創(chuàng)造一個有用的生成式人工智能系統(tǒng),這與人類消費作品時的目的有很大的不同,機器學習系統(tǒng)的訓練顯然是具有高度變革性的。可以說Chatgpt 以其文本創(chuàng)造性輸出的方式改變了原作,所以不應(yīng)當被認為是侵犯了原著作權(quán)人權(quán)利。

        其次是對著作權(quán)人潛在市場的影響。一個典型的案例便是機器翻譯與翻譯作品、譯者語料之間可能存在的著作權(quán)沖突以及相互市場的影響。目前機器翻譯通過不斷提升優(yōu)化自身的底層技術(shù),從原來的主要采用詞典翻譯和規(guī)則翻譯,到利用大規(guī)模的語料庫和統(tǒng)計算法進行翻譯,到目前神經(jīng)網(wǎng)絡(luò)翻譯階段,利用深度學習算法進行翻譯。機器翻譯的質(zhì)量伴隨著技術(shù)的發(fā)展不斷提升,機器翻譯把譯者從機械、枯燥的翻譯工作中解放出來,讓譯者從事更富有創(chuàng)造性的工作。從這個角度可以說,機器學習非但沒有搶占原著作權(quán)人的市場,著作權(quán)人反而可以受益于機器學習相關(guān)技術(shù)的進步,在基礎(chǔ)的工作中節(jié)省精力,提升自己的效率。

        最后,為機器學習創(chuàng)立合理使用類型并非對著作權(quán)人毫無保護。今天的大多數(shù)版權(quán)侵權(quán)分析也內(nèi)含對機器學習技術(shù)的分析。比如YouTube 的侵權(quán)比對系統(tǒng),YouTube 允許版權(quán)所有者向YouTube的內(nèi)容ID 系統(tǒng)提交作品。當一件作品被上傳到Y(jié)ouTube 時,它將與內(nèi)容ID 數(shù)據(jù)庫進行比較,如果該過程中使用作品,分析作品的行為被認定為侵權(quán),將不利于保護著作權(quán)人的權(quán)益。

        同時,機器學習最大的特征是需要使用海量的作品。支付單件作品的成本或許不高,但海量作品累積起來所形成的作品使用費卻很高昂,由此導致機器學習的成本巨大。支付高額的作品許可使用費所增加的成本最終也會反映到產(chǎn)品的售價上來。目前的機器學習技術(shù)尚處在發(fā)展初期,專業(yè)的作品授權(quán)市場還沒有建立,事先取得授權(quán)的方式存在交易成本昂貴且無法有效消解偏見的問題。雖然法定許可制度能夠在一定程度上保障著作人的權(quán)益,但其后續(xù)配套措施的落地還面臨一定的困難,法定許可中的報酬的分配也是個困難的工作,有效執(zhí)行也面臨非常大的阻礙。①劉友華、魏遠山:《機器學習的著作權(quán)侵權(quán)問題及其解決》,《華東政法大學學報》2019年第2期。

        正如前面所述,機器學習的低密度的特點給著作權(quán)的傳統(tǒng)許可方式帶來了巨大挑戰(zhàn):法定許可的最大缺陷在于其無法解決市場失靈問題,同時法定許可因其仍需要與著作權(quán)人協(xié)商許可費,從根本上無法達到提升機器學習效率的目的。反觀合理使用制度,其可以消弭因市場失靈而出現(xiàn)的著作權(quán)人與作品使用者之間為了版權(quán)作品的使用進行協(xié)商的時刻。減少交易費用,提供經(jīng)濟學上合理性的解釋。在沒有合理使用的前提下,使用著作權(quán)人的作品將受到一定限制,而此時引入合理使用規(guī)則就能夠從最大程度上解決交易成本過高的問題。在這一過程中,整個市場在著作權(quán)作品上的資源分配與共享也獲得了實現(xiàn),也避免了訴訟爆炸及嚴重遏制機器學習科技進步的情況。①王文敏:《人工智能對著作權(quán)限制與例外規(guī)則的挑戰(zhàn)與應(yīng)對》,《法律適用》2022年第11期。因此,相比于法定許可制度,合理使用制度更加適合為機器學習提供合法性依據(jù),使用方式得當也不會損害著作權(quán)人的權(quán)利。

        (二)機器學習合理使用的立法路徑與解釋路徑

        為機器學習創(chuàng)設(shè)合理使用類型并非代表著對所有機器學習使用情形都予以保護。目前我國立法仍然會從三步檢驗法以及司法解釋的角度保護著作權(quán)人的合法權(quán)益。從立法角度來看,考慮到我國著作權(quán)法短時間內(nèi)修改的可能性較小,如果需要為機器學習創(chuàng)設(shè)著作權(quán)法中的特例,則需要對《計算機軟件保護條例》《信息網(wǎng)絡(luò)傳播權(quán)保護條例》和《著作權(quán)法實施條例》等法律文件進行修改來增設(shè)權(quán)利類型。因此,在修改《著作權(quán)法實施條例》時引入專門的機器學習例外條款是最好的解決辦法。修改立法也有助于司法機關(guān)對機器學習樹立明確的態(tài)度,最大程度促進技術(shù)的發(fā)展?!吨鳈?quán)法實施條例》是行政法規(guī),如果在其修訂草案中明確增設(shè)機器學習的合理使用情形,將有利于保障著作權(quán)例外情形下的穩(wěn)定性。通過為機器學習制定新的行政立法,來達到合理或適當使用以增進社會利益的目的,沒有超越著作權(quán)人能夠預見的情形。

        值得注意的是合理使用制度是一種對抗專有權(quán)利的制度,允許使用者在滿足條件的情況下對受版權(quán)保護的作品進行復制、傳播等形式的利用,但并不為使用者提供免費獲取作品的渠道。在歐盟國家和英國的版權(quán)例外規(guī)定中,也將“合法獲取”作為適用要件之一,以確保相關(guān)數(shù)據(jù)庫擁有合法訪問權(quán)限。②萬勇:《人工智能時代著作權(quán)法合理使用制度的困境與出路》,《社會科學輯刊》2021年第5期。我國立法時也應(yīng)該引入“合法獲取”作為機器學習合理使用的要件。這樣做可以確保使用者在進行復制、傳播和利用數(shù)據(jù)時具備合法獲取這些數(shù)據(jù)的前提。

        同時,我國著作權(quán)法第二十四條明確規(guī)定,合理使用范圍內(nèi),不得影響該作品的正常使用,不得不合理地損害著作權(quán)人的合法權(quán)益。即使將機器學習納入著作權(quán)合理使用的范圍,也需要通過三步檢驗法對技術(shù)公司使用作品的行為進行判斷,以避免對著作權(quán)人造成損害。將機器學習納入著作權(quán)合理使用的范圍仍然需要判斷該種使用行為是否對著作權(quán)人造成了經(jīng)濟利益損害,產(chǎn)生了替代性的結(jié)果,繼而判斷使用作品行為是否構(gòu)成合理使用。將機器學習技術(shù)納入合理使用范圍并不是意味著技術(shù)可以不加限制地侵害著作權(quán)人的利益,而是需要根據(jù)具體個案考察對于原著作權(quán)人的影響。

        同時為應(yīng)對實踐的需要,目前也需要考慮從法律解釋的角度入手,盡量將部分情形納入現(xiàn)有的合理使用立法文本之內(nèi)。例如從我國著作權(quán)法中關(guān)于合理使用的法律、行政法規(guī)中規(guī)定“其他情形”進行詞義空間的擴大,從而使機器學習“有法可依”。

        目前我國著作權(quán)法第二十四條列舉的“合理使用”的情形中,并沒有明文規(guī)定機器學習這一項,所以機器學習不能直接適用知識產(chǎn)權(quán)的例外規(guī)定。按照我國目前對著作權(quán)法第二十四條第(一)項的規(guī)定,“合理使用”制度主體要件為“個人學習、研究”。但機器學習的主體通常為公司。如果是公司的科研人員,其機器學習行為也很難僅限于“學習、研究”等非商業(yè)目的。但是如果通過對營利性主體所進行的“科研”做擴大解釋,可能可以作為機器學習中的作品使用行為應(yīng)急之策。如若部分使用機器學習的公司提供了基礎(chǔ)性技術(shù),如通過人臉識別技術(shù)為安全、國防等領(lǐng)域提供保障,可以作為其進行人臉學習研究的合法性依據(jù)。

        同時根據(jù)我國目前的《著作權(quán)法》第二十四條第(二)項的規(guī)定,“為介紹評論某一作品或者說明某一問題,在作品中適當引用他人已經(jīng)發(fā)表的作品”,可以不經(jīng)著作權(quán)人許可亦無須支付報酬。根據(jù)法條文本內(nèi)容,機器學習使用數(shù)據(jù)的目的如果是評論與說明,可以考慮通過此條為自身行為提供合法依據(jù)。但在機器學習中使用數(shù)據(jù)時,需要遵守“適當引用”的原則,即對于已有作品的使用必須符合一定的適當性要件,避免對著作權(quán)人的利益造成損害。適當引用的要求包括以下幾個方面。首先,被引用部分不能構(gòu)成被引作品的主要部分或?qū)嵸|(zhì)部分,即引用作品與被引作品應(yīng)具有明顯的區(qū)別。這是為了確保引用作品不成為作品的“競爭者”,對著作權(quán)人的創(chuàng)作權(quán)益產(chǎn)生不利影響。其次,引用的數(shù)量應(yīng)適度,不能超過合理的范圍。這意味著在機器學習中使用數(shù)據(jù)時,需要適度地引用著作權(quán)作品的內(nèi)容,以避免超過適當?shù)囊梅秶?。最后,引用的方式和目的?yīng)當符合合理的學術(shù)研究或創(chuàng)新需求,而不是為了商業(yè)化或直接替代原作品。

        同時我國著作權(quán)法第二十四條第(六)項和第(八)項規(guī)定,以科學技術(shù)發(fā)展或是以文化遺產(chǎn)機構(gòu)收藏為目的而利用作品的行為,都可能具有對計算機學習技術(shù)適用“合理使用”的余地。該情況下的科研機構(gòu)如若也使用機器學習技術(shù),可以從該角度為其提供合法依據(jù)。

        機器學習使用作品的情形也可以在滿足三步檢驗法的角度下被解釋為合理使用的情形。司法實踐可以對我國著作權(quán)法第二十四條“法律、行政法規(guī)規(guī)定”等相關(guān)規(guī)定作出整體性解釋。使之不僅包括法律規(guī)定合理使用情況下的具體條款,也包括在法律規(guī)范功能原則下的規(guī)定應(yīng)符合國際公約中的“特定、特殊情形”的具體條款。事實上,我國司法實踐早已突破了上述三步檢驗法的第一個環(huán)節(jié)中的限制,將部分行為視為合理使用,比如出于教學目的拍攝電影、為拍賣目的展示圖冊,以及網(wǎng)頁“快照”的使用行為。如若立法無法及時滿足實踐的需要,則可以考慮從法律解釋的角度入手,盡量將部分情形納入現(xiàn)有的合理使用立法文本之內(nèi),借此為合理使用制度創(chuàng)造更多空間。

        結(jié)語

        既然目前的技術(shù)發(fā)展和現(xiàn)有的法律制度存在沖突,為保障技術(shù)發(fā)展以及法律的適應(yīng)性,我們討論當前話題仍然是有意義的。本文在第一部分明確了目前著作權(quán)法、著作權(quán)人與利用作品進行機器學習的科技公司主體之間的矛盾,在第二部分通過探討是否應(yīng)當通過著作權(quán)例外來解決此矛盾,以及在第三部分探討具體運用著作權(quán)哪一種例外解決矛盾,并分析了不同手段可能帶來的潛在優(yōu)勢與劣勢,以及為機器學習設(shè)定合理使用類型和司法解釋如何為機器學習掃平障礙進行了說明。

        從域外的立法情況來看,為了便利機器學習和運用大數(shù)據(jù)分析,多國政府也曾多次修訂了其著作權(quán)法。比如日本在2018 年修訂著作權(quán)法后,將機器利用信息的研究領(lǐng)域范圍從“計算機信息分析”拓展為所有“提供新的知識和信息”領(lǐng)域。修訂后的法規(guī)擴大了侵權(quán)豁免的商業(yè)行為范圍,為盈利性活動也留下了適當空間。另外,為減少上面所列出的條款帶來的法律使用空間僵化,日本引入了柔性合理使用條款,具體為:日本著作權(quán)法第30 條之四非享受性使用條款、第47 條之四計算機附隨性使用條款以及第47 條之五信息處理輕微利用條款。①鄭重:《日本著作權(quán)法柔性合理使用條款及其啟示》,《知識產(chǎn)權(quán)》2022年第1期。2014 年的英國版權(quán)法、2016 年的法國著作權(quán)法、2017 年的意大利著作權(quán)法都規(guī)定可以對版權(quán)產(chǎn)品實施復制,雖然僅限于非商業(yè)性的研究目的。2016 年歐盟委員會制定的版權(quán)指令草案,明確了文本數(shù)據(jù)保存、挖掘方面的版權(quán)例外,適用對象主要是社會公益組織和科研機構(gòu),以非商業(yè)性目的作為潛在語境,也體現(xiàn)出了歐洲各國對謹慎立法的態(tài)度。2019 年,由歐盟委員會所制定的《單一數(shù)字市場版權(quán)指令》(Directive on Copyright in the Digital Singles Market,下稱《DSM 指令》)采取分類處理的辦法,即例外情形區(qū)分以科學研究為目的的文本與數(shù)據(jù)挖掘和不限目的的文本與數(shù)據(jù)挖掘?!禗SM 指令》為科學研究中的文本與數(shù)據(jù)挖掘提供了更大的自由度。①張惠彬、肖啟賢:《人工智能時代文本與數(shù)據(jù)挖掘的版權(quán)豁免規(guī)則建構(gòu)》,《科技與法律(中英文)》2021 年第6期。美國的最高法院也有裁決,認為利用作品、使用數(shù)據(jù)的行為一旦能夠取得相應(yīng)的社會公益效果,能夠經(jīng)由合理使用而得以規(guī)范。②張潤、李勁松:《利益平衡視角下人工智能編創(chuàng)使用行為的法律定性與保護路徑研究》,《出版發(fā)行研究》2020 年11期。我們看到各國從“文本挖掘”,到“文本與數(shù)據(jù)挖掘”再到“提供新的知識和信息”,法律所允許的機器學習的材料與范圍在不斷擴大,除文本外,藝術(shù)作品也逐漸成為機器學習的內(nèi)容,未來有可能涵蓋更多的作品類型。

        盡管各國立法目前對于機器學習自由使用作品都較為保守,但各國對于著作權(quán)例外可能帶來的價值是有所認識的,這就體現(xiàn)在前述不斷修改的立法中。同時各國也認識到,機器學習技術(shù)所蘊含的重大社會意義,可以利用該項技術(shù)為國家經(jīng)濟與社會的發(fā)展服務(wù),例如歐洲經(jīng)濟委員會曾表示:“伴隨著數(shù)字革命,機器學習已經(jīng)成為日常生活的一部分。目前數(shù)據(jù)體量的不斷擴大,以及機器學習對于數(shù)據(jù)的依賴更深,對于數(shù)據(jù)廣度的要求也不斷加深?!雹勐?lián)合國歐洲經(jīng)濟委員會:機器學習為生成現(xiàn)代、高效的統(tǒng)計數(shù)據(jù)鋪平道路,https://news.un.org/zh/story/2021/04/1082222,最后訪問時間:2023年11月11日。這也說明機器學習的應(yīng)用的確為社會發(fā)展帶來了機遇。柏林一家智庫墨卡托中國研究所的政治學家Kristin Shi-Kupfer表示,如果中國不能在機器學習方面取得真正的突破性研究進展,中國在人工智能領(lǐng)域很難取得突破性成果。④Sarah O'Meara:《中國的人工智能是否會在2030年領(lǐng)先世界》,https://news.sisuer.cn/wp-content/uploads/2020/06/Will-China-lead-the-world-in-AI-by-2030.pdf,最后訪問時間:2023年11月11日。這也從側(cè)面說明機器學習可以為各個領(lǐng)域的發(fā)展提供強大的數(shù)據(jù)分析和模式識別能力,有助于挖掘和利用海量數(shù)據(jù)中有價值的信息,推動科學研究和創(chuàng)新發(fā)展,如果中國重視機器學習技術(shù),就將對中國人工智能領(lǐng)域起到積極推動作用。

        可以設(shè)想,在中國機器學習科技高速成長的時期,我國法學界終將無法避免對機器學習的拷貝作品、分析作品、輸出表達等活動進行價值評判。如果認為機器學習不構(gòu)成合理使用,就會導致很多正在開展人工智能研究項目的個人或者組織(尤其是企業(yè))為大量使用著作付費,或者將獲得保護的著作全部清理出數(shù)據(jù)庫,這就大大增加了我國本土企業(yè)開發(fā)機器學習技術(shù)的成本,也妨礙了我國機器學習技術(shù)的正常發(fā)展。若將其定義為合理使用,則能夠為我國的人工智能領(lǐng)域的發(fā)展以及第四次信息技術(shù)工業(yè)革命中所涉及的整個產(chǎn)業(yè)提供一定的競爭性優(yōu)勢,⑤張金平:《人工智能作品合理使用困境及其解決》,《環(huán)球法律評論》2019年第3期。是著作權(quán)制度中平衡著作權(quán)人、社會公共利益和使用者利益的有效措施。希望通過本文的討論,能夠促進這項制度的完成,為機器學習使用作品和數(shù)據(jù)提供法律依據(jù),減少成本,促進新型行業(yè)的發(fā)展。

        在线视频一区色| 亚洲国产大胸一区二区三区| 久久精品女同亚洲女同| 亚洲无线一二三四区手机| 亚洲乱亚洲乱少妇无码99p| 成人午夜无人区一区二区| 精品国产3p一区二区三区| 中文字幕一区二区三区视频 | 五月天欧美精品在线观看| 色中文字幕视频在线观看| 偷拍一区二区盗摄视频| 羞涩色进入亚洲一区二区av| 久久综网色亚洲美女亚洲av | 熟妇人妻不卡中文字幕| 亚洲av日韩综合一区尤物| 成人免费无码大片a毛片抽搐色欲| 亚洲av无码日韩精品影片| 国产在线欧美日韩精品一区二区| 按摩少妇高潮在线一区| 草色噜噜噜av在线观看香蕉| 制服丝袜人妻中文字幕在线| 久久久久久久久中文字幕| 国产一级黄色片在线播放| 精品国产麻豆免费人成网站| 亚洲中文字幕无码中字| 日韩精品视频免费福利在线观看| 粉嫩国产av一区二区三区| 最近中文字幕大全在线电影视频| 久久国产亚洲精品超碰热| 饥渴少妇一区二区三区| 亚洲午夜久久久精品影院| 美女脱了内裤张开腿让男人桶网站 | 人妻无码Aⅴ中文系列| 91人妻人人做人人爽九色| 人成午夜大片免费视频77777| 亚洲国产综合精品 在线 一区| 亚洲精品动漫免费二区| 华人在线视频精品在线| 日本久久高清一区二区三区毛片| Y111111国产精品久久久| 国产在线视频一区二区三区不卡|