◎ 盧炳宏
目前,我國學者正在如火如荼地研究關于“人工智能生成物的法律屬性及可版權性”等問題,但本文的意圖不是討論人工智能輸出內容的法律屬性,而是關注人工智能未經授權使用版權數(shù)據(jù)(內容輸入)的合法性問題。探討輸出內容的版權性問題應該建立在輸入內容的合法性證成基礎之上,然而學界對此問題的研究成果寥寥。人工智能正在以“讀者”的身份快速消費人類的作品,并從中挖掘數(shù)據(jù)表達內容的價值。在人工智能算法培訓數(shù)據(jù)庫中,如果包含未經授權復制的版權數(shù)據(jù),合理使用制度能否為其進行侵權抗辯?面對此問題,傳統(tǒng)的合理使用制度出現(xiàn)了理論失靈,現(xiàn)有理論應對能力不足。需要重新審視人工智能語境下合理使用制度的價值功能,合理配置各權利人之間的利益需求,以求維護版權數(shù)據(jù)所有人的利益,促進人工智能產業(yè)的良性發(fā)展。
非表達性使用是指僅使用他人版權作品的事實性信息或著重分析原始數(shù)據(jù)文本的物理特征,而不涉及版權作品獨創(chuàng)性表達內容的使用。在Sega v .Accolate案中,被告未經授權復制了原告運行游戲機的源代碼,法院判定被告的中間復制行為是合理使用。被告復制的目的是實現(xiàn)軟件兼容功能而采取的必要技術手段,最終產品僅包括為實現(xiàn)兼容目的界面代碼,并不具有利用原告作品表達內容的目的,屬于非表達性使用。在Authors v.Google案中,谷歌搜索引擎向用戶展示的僅僅是關于圖書的事實類信息,復制圖書的目的僅限于提供搜索服務功能,并沒有直接將圖書的表達內容提供給公眾全面閱讀欣賞,法院裁定谷歌掃描復制圖書的行為屬于合理使用。非表達使用的復制行為屬于實現(xiàn)技術功能的必要手段,使用的是版權數(shù)據(jù)的事實類信息,并沒有將版權作品的獨創(chuàng)性表達內容公開傳遞給消費者,沒有產生作品獨立利用和傳播的負面影響,不會影響原作品的正常使用,使用非表達性事實信息的行為并不在作者版權權能的可控制范圍內。非表達性使用具有很強的目的轉換性功能,即使谷歌公司的商業(yè)屬性也可以得到合理使用制度的原諒。與此同時還可以為機器學習技術提供豐富的訓練素材,促進人工智能產業(yè)的良性發(fā)展。無論從法律制度還是產業(yè)政策上,非表達性使用得到合理使用制度的庇護均具有正當性和必要性基礎。
非表達性使用作為認定合理使用的標準之一,很大程度基于這樣一種假設:計算機無法像人類作者一樣具有表達創(chuàng)作能力,無法產出具有版權保護的獨創(chuàng)性表達。但是這種假設似乎對那些具有表達性功能的人工智能不太適用。人工智能可以“創(chuàng)作”的事實并不算新鮮事,例如“微軟小冰詩歌作曲項目”“下一個勃朗特繪畫項目”“騰訊Dreamwriter新聞寫作項目”等。這些人工智能生成品在不告知受眾信息來源的情況下,已經很難分辨出到底是人工智能還是人類作出的。據(jù)筆者統(tǒng)計,我國多數(shù)學者認為人工智能生成物具有可版權性,符合獨創(chuàng)性標準。我們不得不面對這樣的事實,人工智能已經具備了一定的表達創(chuàng)作能力,筆者稱之為“表達型人工智能”,它們可以充分利用版權數(shù)據(jù)的獨創(chuàng)性表達內容,利用精確統(tǒng)計、分析數(shù)據(jù)的能力,通過模擬人類神經網絡的方式進行數(shù)據(jù)學習訓練,根據(jù)自身獲取的數(shù)據(jù)來實施創(chuàng)作,并且可以創(chuàng)造出具有很高商業(yè)價值的數(shù)據(jù)成果,它們已經學會從作品的表達內容中挖掘出價值,而不再局限于事實信息的整理分析。
合理使用不是表達型人工智能隨意剽竊作品的許可證。在數(shù)據(jù)輸入階段,為培訓算法模型,未經授權或者破譯技術保護措施使用版權作品的行為,屬于推定的版權侵權。在算法培訓階段,版權數(shù)據(jù)可能會被多次復制、修改和反復運行,雖然有些復制版本存在的時間很短暫,但是確實創(chuàng)建了侵犯版權的副本,并有可能從輸入數(shù)據(jù)中衍生出具有相同或類似風格的演繹作品。雖然風格屬于思想的范疇,不受版權法保護,但是相似的輸出很可能會影響原作市場的價值,甚至形成市場替代效應。即使使用授權的版權數(shù)據(jù)也有可能會承擔法律責任,因為權利人授權使用作品的目的與表達型人工智能使用的目的并不一致。將授權作品用于培訓表達型人工智能進行創(chuàng)作,目的是產生具有市場競爭性的同類衍生作品,可能會超出版權許可協(xié)議的使用范疇。為了避免侵權的風險,使用者一般會采取“用戶服務條款”的方式來免費獲取用戶版權作品數(shù)據(jù)的使用權,為其人工智能算法培訓而服務。但是這種格式條款協(xié)議本身的合法性值得推敲,平臺服務商可能沒有盡到合理的提示注意義務,導致多數(shù)用戶并沒有過多地關注版權協(xié)議的內容,用戶知情權、信息自決權等權益無法保障,基于互聯(lián)網巨擘企業(yè)利用數(shù)據(jù)壟斷的優(yōu)勢地位,主體地位的不平等很難保證利益分配的公平。用版權數(shù)據(jù)利益換取平臺提供的免費服務,這種交易對價的公平性也值得懷疑,協(xié)議內容的合法性缺乏有效的外部監(jiān)督機制。
人工智能的新興利用不再局限于非表達性使用,不符合合理使用制度的規(guī)范條件。主要表現(xiàn)為:第一,表達型人工智能的商業(yè)性使用具有營利性目的;第二,表達型人工智能的使用行為構成了市場替代威脅,對作品的價值及潛在市場利益產生了不利影響。
使用者免費使用他人作品并獲得實質性利益而沒有對作者進行任何補償,不符合合理使用制度利益平衡的價值功能。谷歌利用“深度學習”技術推出的 Gmail 功能,可以幫助用戶閱讀郵件并進行智能回復。為了讓智能回復功能算法更加智能化、人性化,谷歌開始利用數(shù)字圖書館中的小說類圖書,因為小說的表達內容更貼近人們日常生活中的表達方式,這種使用行為盜用了小說作者豐富多彩的表達性內容,不屬于非表達性使用,是一種推定的版權侵權。一般來說,合理使用限于已發(fā)表的作品,對于未發(fā)表的個人信件,無論出于什么目的,都有可能侵害作者的“發(fā)表權和隱私權”。谷歌很有可能利用該數(shù)據(jù)庫培育出具有巨大商業(yè)價值的表達型人工智能,創(chuàng)造出大量的具有獨創(chuàng)性表達內容的“作品”,進而威脅作者的地位及潛在的市場利益,此時缺乏先定力的合理使用制度能否為這種營利性目的使用開脫是值得質疑的。
表達型人工智能的營利性使用行為,對作品的價值和潛在市場利益會造成一定損害,這種損害是真實存在的,也絕非合理使用制度所能包容的輕微性損害。若毫無限制地放縱此類使用行為,將會顛覆以作者利益為核心的版權制度范式,打造以“人工智能使用者權”為中心的、失衡的版權利益分配格局。
人工智能學習技術可以從毫無價值的數(shù)據(jù)中產生價值,并培育出前所未有的數(shù)據(jù)許可、數(shù)據(jù)共享市場。通過輸入海量數(shù)據(jù)培訓人工智能,可以創(chuàng)造出具有巨大商業(yè)潛力的算法模型,而每個輸入數(shù)據(jù)的價值與算法模型的價值相比遠遠不及。對于培訓數(shù)據(jù)所形成的市場,作者是否有權利參與其中并獲得相應的收益呢?從“谷歌數(shù)字圖書館”一案所達成的和解協(xié)議內容上看,谷歌愿意對未經授權復制作品的非表達性使用行為進行談判,并愿意同版權數(shù)據(jù)所有者分配市場利益??梢源_定海量數(shù)據(jù)的許可使用能夠產生相當可觀的市場收益,并且為版權人提供一個非表達性使用需要付費許可的可能性。如果表達型人工智能使用這些數(shù)據(jù)的行為被定性為合理使用,作者可能無法參與數(shù)據(jù)許可市場利益的分配。
從長遠角度看,表達型人工智能衍生的版權市場不僅侵害作者的數(shù)據(jù)許可市場利益,更有可能威脅到整個人類作者群體在版權交易市場的地位?!跋鄬Ψ€(wěn)定的市場向相對固定的用戶群提供相對不變的產品,因而即便是新型衍生市場吸引相當小部分的原市場用戶也會被視為具有商業(yè)影響而構成對原產品的商業(yè)替代,具有影響原產品相對穩(wěn)定市場的風險。”“考慮到人工智能創(chuàng)作物的低成本、高效率,一般的人類作者在版權市場的定價能力將受到削弱?!碑敯鏅嗍袌龀涑庵罅康娜斯ぶ悄茏髌窌r,某些創(chuàng)作領域的人類作品可能會被替代,尤其以數(shù)據(jù)主導的創(chuàng)作行業(yè)的作者地位更是岌岌可危。
絕對化的將表達型人工智能的使用行為定性為版權侵權,將會產生難以挽回的后果。版權法提供的侵權補救措施與數(shù)據(jù)作者的損失可能無法適當匹配。例如“谷歌數(shù)字圖書館”一案,如果輸入數(shù)據(jù)是享有版權的,那么每個數(shù)據(jù)的作者可以獲得750美元的法定損害賠償??上攵雀钄?shù)字圖書館數(shù)據(jù)庫包含數(shù)十萬乃至數(shù)百萬條的版權數(shù)據(jù),如果利用此標準,那么谷歌這樣強大的企業(yè)也會面臨癱瘓的風險。或許法院不會采取過激的法定賠償標準去判決,但是一項不利的判決會在整個技術行業(yè)內引起“寒蟬效應”,甚至包括那些非商業(yè)性、非表達型人工智能的使用行為也會擔心觸碰版權侵權的界限。合理使用制度不是現(xiàn)代科學的對立物,現(xiàn)代科學技術也不是合理使用制度的掘墓人。
毫無限制的允許表達型人工智能大量消費作者的版權數(shù)據(jù),可能會導致作者群體地位的邊緣化。此外,當版權市場充斥著大量可版權性的人工智能作品時,基于版權壟斷效應反而可能會限制社會公眾的表達自由。也許有人會質疑,何必在乎是由人類創(chuàng)作還是由人工智能創(chuàng)作的。這種想法恐怕與版權法的精神相違背,版權法是以人類為中心建立的法律制度,它在乎作品的數(shù)量,更加在乎人類彌足珍貴的創(chuàng)作表達能力和表達自由。而毫無限制地放任表達型人工智能的使用,可能會因缺乏激勵對人類的創(chuàng)作表達能力和表達自由產生不利的影響。試想人工智能消費版權作品不需要提供任何補償,而人類作者卻要為翻譯、改編版權作品支付費用,這顯然有點荒謬。更令人擔憂的是,表達型人工智能合理使用模式可能會進一步拉大社會的貧富差距。人們創(chuàng)建了大量的文本、視頻、圖像和其他數(shù)據(jù),并將這些數(shù)據(jù)通過“用戶服務條款”授權給互聯(lián)網平臺公司以換取免費的服務。而強大的公司利用人工智能技術從版權數(shù)據(jù)的使用者逐漸向人工智能版權作品所有者身份過渡,這一身份的轉化提醒著我們:傳統(tǒng)的合理使用制度在人工智能時代開始出現(xiàn)失靈,即無法公正地在用戶和公司之間分配利益,正在促使版權利益從作者那里轉向商業(yè)集團。互聯(lián)網平臺公司的商業(yè)模式遵循這樣一種贏家通吃的經濟循環(huán)鏈條,幫助公司鞏固了市場競爭的優(yōu)勢。合理使用制度作為公共利益的安全閥,平衡了使用者表達自由與版權所有者經濟權利的沖突。但是如果這一理論發(fā)展到毫無限制地賦予表達型人工智能免費使用版權者數(shù)據(jù)的權利,換取的是以損害版權者數(shù)據(jù)的權利來滋養(yǎng)公司壟斷版權數(shù)據(jù)市場的野心,這種利益分配的集中化最終會導致社會貧富差距的進一步擴大。
合理使用制度與生俱來的不可預測性在人工智能時代表現(xiàn)得更加突出,可以采取類型化的分析方式,將使用目的作為界定合理性的邏輯基礎,為使用者提供一種清晰明確的行為預期,有效平衡技術發(fā)展與版權保護的沖突。
以獲取事實性信息為目的使用行為。在“Authors Guild v. Google Inc”“Perfect 10 v. Google”“Blake A. Field v. Google”三個案例中,谷歌公司未經授權使用版權作品的行為均構成轉換性的合理使用。因為其主要使用的目的并不是利用作品的表達性要素進而形成原作的替代品,而是利用了作品中的非表達性事實信息,如并非再現(xiàn)網頁內容的快照瀏覽功能、并非美學或娛樂目的縮略圖搜索功能、并非提供圖書版權表達內容的事實信息檢索功能。這些服務公眾利益需求的功能具有高度的目的轉換性,符 合合理使用制度促進文化信息共享的理念。
以生產性表達為目的的使用行為。需要強調的是,并不是所有未經授權使用作品表達內容的行為都是侵權行為,如為了評論、介紹他人作品適當引用的行為,為了時事新聞報道不可避免的使用行為等屬于侵權例外,這些行為可以激發(fā)使用者生產新的表達、美感或信息,他們自己就是新作品的生產者。新作品的受眾群體與市場不同于原作品,并不會形成替代作用。構成“轉換性合理使用”是為了防止版權壟斷的冰凍效應阻礙公眾對知識的利用,激勵使用者生產出更好的作品,使用內容的數(shù)量也是限定不能超過一定的比例,而且要求注明使用作品來源信息,不會影響原來作品的正常使用。具有高度內容轉換性的使用方式同樣可以適用于人工智能生產創(chuàng)作,符合合理使用制度促進文化事業(yè)繁榮的理念。
以技術實施與進步為目的的使用行為?!芭袛啻龠M技術進步的合理使用,其重要的考慮因素有:作品使用的目的是否屬于轉換性的使用,社會公眾是否受益于該技術的發(fā)展,該技術對版權作品的使用是否構成對原作的替代性使用?!睘闇y試人臉識別算法性能而使用海量圖片數(shù)據(jù)庫的行為,是以技術進步為目的的,并沒有使用版權圖片的表達性因素,也不會對原作版權市場利益造成嚴重影響。為了糾正算法偏見引發(fā)的不公正危害,算法問責程序對作品的利用,都應當納入合理使用的范圍,使其獲得更全面、更客觀的數(shù)據(jù)信息。以技術實施與進步為必要的使用行為,符合合理使用制度促進科技產業(yè)發(fā)展的理念。
人工智能學習技術擴大了作品的使用方式,必然會導致一定范圍內合理使用向許可使用的過渡。法律經濟學的核心思想是效益,根據(jù)帕累托標準即效益的提高必須是對各方都有益,以損害某一方利益來改善他方利益的方法是非效益的。合理使用只有對作者和使用者都有利時方屬“合理”,否則將因“經濟合理性”的欠缺而導致無效益。人工智能使用行為給人工智能產業(yè)公司帶來了實質性的收益,是否處于公平考慮而給予著作權人適當?shù)难a償?法定許可制度在簡化作品獲取和使用程序的同時,能較好地平衡作品的保護與技術發(fā)展的訴求,平衡各方利益,長遠來看不失為一種可取的理想方案和制度安排。
技術進步與版權保護總是在處于動態(tài)平衡之中。為了緩解數(shù)字磁帶技術的應用損害音樂版權產業(yè)發(fā)展的問題,美國頒布的家庭錄音法案允許個人非商業(yè)性使用音樂作品,數(shù)字錄音設備制造公司應當向音樂版權人繳納合理的使用費用。法案產生的背景與當今表達型人工智能使用困境十分相似。建立類似法定許可制度的稅收分配機制,可以有效平衡使用者與權利人之間的利益??梢詤⒖脊雀钄?shù)字圖書館的和解協(xié)議中規(guī)定的方式,“建立圖書版權登記機構,分配谷歌圖書銷售的收益及廣告盈余,并將其分發(fā)給版權所有者”。另外,對于孤兒作品的使用收益可以考慮分配給社會保障機構,以保障版權作者及那些可能被人工智能取代的群體的利益。建立版稅征收制度是西方國家版權立法的趨勢,必然存在一定的合理性基礎,絕不可輕易作出否定的評判。
注釋:
① 以吳漢東、易繼明、熊琦、梁志文等教授為代表的大多數(shù)學者都認為人工智能生成成果具有可版權性,王遷教授持反對意見。
② JISUK W.Redefining the “Transformative Use” of Copyrighted Works: Toward a Fair Use Standard in the Digital Environment[J].The Hastings COMM/ENT Law Journal,2004:12.
③ 曹源.人工智能創(chuàng)作物獲得版權保護的合理性[J].科技與法律,2016(3):503.
④ 吳漢東.著作權合理使用制度研究[M].北京:中國政法大學出版社,2005:239.
⑤⑦EDWARD L.Technological Fair Use[J].Cal. L.Rev,2010(83):22,61.
⑥ 張穎.人工智能編創(chuàng)過程中的著作權問題探析[J].中國編輯,2018(9):85.
⑧ 劉友華,魏遠山.機器學習的著作權侵權問題及其解決[J].華東政法大學學報,2019(2):78.
⑨ 馬麗萍.谷歌數(shù)字圖書館事件中的合理使用問題研究[J].圖書館學研究,2012(19):88.