一、現(xiàn)有法律問(wèn)題
生成式人工智能應(yīng)用(以下簡(jiǎn)稱“生成式AI”)的法律問(wèn)題并不復(fù)雜,之前討論大多集中在信息安全風(fēng)險(xiǎn)規(guī)制問(wèn)題【從已經(jīng)備案甚至落地的生成式AI服務(wù)來(lái)看,并未引發(fā)人們預(yù)想的傳播風(fēng)險(xiǎn),除平臺(tái)自身審查外,更主要是該服務(wù)質(zhì)量較ChatGPT尚有差距,且未嵌入貼近普通用戶的場(chǎng)景,以致應(yīng)用程度不高?!?,在《生成式人工智能服務(wù)管理暫行辦法》發(fā)布后開(kāi)始轉(zhuǎn)向技術(shù)應(yīng)用過(guò)程中的知識(shí)產(chǎn)權(quán)侵權(quán)問(wèn)題。相關(guān)知識(shí)產(chǎn)權(quán)侵權(quán)大致可分為大模型訓(xùn)練語(yǔ)料庫(kù)內(nèi)容侵權(quán)和生成作品被侵權(quán)兩個(gè)層次,后者是個(gè)老問(wèn)題,還可以一直延伸至人工智能能否成為作者甚至法律主體的討論【參見(jiàn)吳漢東:《人工智能時(shí)代的制度安排與法律規(guī)制》,載《法律科學(xué)》2017年第5期。】;而前者引發(fā)的糾紛逐漸增多。本文將聚焦于前者,討論如何看待語(yǔ)料庫(kù)來(lái)源合法性引發(fā)的糾紛以及這將如何影響此種技術(shù)和行業(yè)的未來(lái)?!久绹?guó)已出現(xiàn)多起著作權(quán)人起訴生成式AI企業(yè)的訴訟,都在進(jìn)行中?!?/p>
隨著生成式AI的落地,種種跡象表明,該行業(yè)正經(jīng)歷互聯(lián)網(wǎng)發(fā)展早期“非法興起”的關(guān)鍵而漫長(zhǎng)的階段。【胡凌:《非法興起:理解中國(guó)互聯(lián)網(wǎng)演進(jìn)的一個(gè)視角》,載《文化縱橫》2016年第5期。】通俗地說(shuō),生成式AI背后的大模型需要更多真實(shí)和高質(zhì)量的語(yǔ)料庫(kù)進(jìn)行訓(xùn)練,才可能對(duì)有效標(biāo)記進(jìn)行評(píng)估和預(yù)測(cè),并根據(jù)提示詞生成用戶想要的內(nèi)容。除算力外,從何處獲取高質(zhì)量語(yǔ)料庫(kù)或數(shù)據(jù)集就成了該行業(yè)繞不開(kāi)的核心問(wèn)題?!竟I(yè)和信息化部等六部門印發(fā)的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》。】
購(gòu)買正版語(yǔ)料庫(kù)是一個(gè)選擇。事實(shí)上數(shù)據(jù)標(biāo)注投喂算法這一商業(yè)過(guò)程很早就開(kāi)始了,很多企業(yè)一直在進(jìn)行人工標(biāo)注,或者專門收集和錄制特定種類數(shù)據(jù)出售,更多的還是在專門領(lǐng)域積累機(jī)器學(xué)習(xí)數(shù)據(jù)。對(duì)追求通用化的大模型而言,需要結(jié)構(gòu)化的數(shù)據(jù)體量更加龐大。依靠用戶創(chuàng)造內(nèi)容的平臺(tái)企業(yè)并不缺乏數(shù)據(jù),其模式本身就是在用戶自產(chǎn)自銷過(guò)程中來(lái)追蹤內(nèi)容生產(chǎn)者和消費(fèi)者行為,使用算法分析進(jìn)行精準(zhǔn)匹配。如果開(kāi)發(fā)大模型,無(wú)非是在現(xiàn)有模式基礎(chǔ)上增加機(jī)器生產(chǎn)和更加自動(dòng)化的分析,這一切都在平臺(tái)創(chuàng)設(shè)的空間內(nèi)部完成。要想真正有能力部署有效果的大模型應(yīng)用,勢(shì)必依托于擁有廣泛用戶的在線服務(wù),從而實(shí)時(shí)獲取更新的數(shù)據(jù)。如果缺乏用戶為其生產(chǎn)語(yǔ)料庫(kù),自己就需要進(jìn)一步購(gòu)買或抓取網(wǎng)絡(luò)公開(kāi)數(shù)據(jù),而這又是一般生成式AI企業(yè)不愿意付出的成本,因?yàn)樗鼈儫o(wú)法預(yù)估購(gòu)買訓(xùn)練數(shù)據(jù)的效果和直接市場(chǎng)價(jià)值。
以往關(guān)于生成式AI侵權(quán)的分析容易脫離商業(yè)模式和市場(chǎng)結(jié)構(gòu)抽象討論。就個(gè)案來(lái)說(shuō),從現(xiàn)有法律中找到一些相對(duì)確定的答案解決糾紛并不太難。第一,如果發(fā)生了某生成式AI企業(yè)使用未經(jīng)授權(quán)的作品或數(shù)據(jù)集進(jìn)行訓(xùn)練,盡管難以從生成結(jié)果和學(xué)習(xí)過(guò)程中取證,但在企業(yè)內(nèi)部獲取一些涉及大量?jī)?nèi)容文本復(fù)制傳輸行為的證據(jù)相對(duì)容易。第二,盡管“機(jī)器學(xué)習(xí)”是個(gè)技術(shù)術(shù)語(yǔ),但認(rèn)定為數(shù)據(jù)處理(涵蓋了復(fù)制和使用)問(wèn)題不大,那么未經(jīng)授權(quán)或沒(méi)有盡到合理注意義務(wù)就會(huì)有較為顯著的著作權(quán)侵權(quán)風(fēng)險(xiǎn)。第三,就算無(wú)法認(rèn)定為匯編作品,語(yǔ)料庫(kù)作為一個(gè)整體也可得到《反不正當(dāng)競(jìng)爭(zhēng)法》的保護(hù)。在以往相當(dāng)多案件中,通過(guò)爬蟲(chóng)或其他非法手段獲取既有平臺(tái)企業(yè)的數(shù)據(jù)并不鮮見(jiàn),法院也大多以不正當(dāng)競(jìng)爭(zhēng)訴訟解決了。
如果只分析至此,無(wú)助于我們對(duì)真實(shí)問(wèn)題的理解,即司法需要采取何種對(duì)策回應(yīng)才合適。對(duì)事后法律適用而言,區(qū)分算法是否由大模型驅(qū)動(dòng)的意義不大,只要關(guān)注企業(yè)外在行為和后果即可,而生成式AI治理看起來(lái)更多屬于產(chǎn)業(yè)政策問(wèn)題,無(wú)法完全由司法行為主導(dǎo)。然而,個(gè)案中的裁判仍然有意義,侵權(quán)認(rèn)定和判罰標(biāo)準(zhǔn)的高低都會(huì)釋放對(duì)新技術(shù)行業(yè)態(tài)度的不同信號(hào),影響投資者行動(dòng)。在當(dāng)下強(qiáng)調(diào)訴源治理的大背景下,有必要考慮為何此類糾紛會(huì)發(fā)生、生成式AI想要什么以及如何發(fā)揮司法的邊際作用,從而幫助降低行業(yè)發(fā)展的制度成本,實(shí)現(xiàn)合作共贏。
如果大量高質(zhì)量語(yǔ)料庫(kù)掌握在不同企業(yè)手中,生成式AI企業(yè)自然可以通過(guò)談判進(jìn)行交易。但問(wèn)題在于,部分大模型開(kāi)發(fā)者難以通過(guò)合理價(jià)格獲取想要的訓(xùn)練數(shù)據(jù),這涉及相當(dāng)多的問(wèn)題。例如,數(shù)據(jù)本身的價(jià)值無(wú)法通過(guò)市場(chǎng)得以展示或定價(jià)、從購(gòu)買數(shù)據(jù)到訓(xùn)練后形成穩(wěn)定的商業(yè)模式需要比較長(zhǎng)的時(shí)間,以及如果缺乏足夠多的前期投入基本上不太可能成功。這也是為什么經(jīng)過(guò)大約半年的炒作,大模型市場(chǎng)泡沫開(kāi)始退去。除去經(jīng)濟(jì)下行因素,資本投資也比較謹(jǐn)慎,那些缺乏明確商業(yè)模式的項(xiàng)目可能都無(wú)法進(jìn)行。因此人們對(duì)語(yǔ)料庫(kù)價(jià)格的預(yù)期就不太可能過(guò)高,但同時(shí)相當(dāng)多語(yǔ)料庫(kù)企業(yè)對(duì)其持有的結(jié)構(gòu)化數(shù)據(jù)都抱有樂(lè)觀態(tài)度,他們寧愿待價(jià)而沽或者在談判時(shí)“敲竹杠”。理性的語(yǔ)料庫(kù)企業(yè)已經(jīng)認(rèn)識(shí)到即使授權(quán)給大模型企業(yè),也未必能得到即時(shí)回報(bào),考慮到市場(chǎng)的不確定性,更有可能抬高價(jià)格,賺取短期收益。特別是那些已經(jīng)擁有廣泛內(nèi)容生態(tài)的平臺(tái)企業(yè)會(huì)更加謹(jǐn)慎,因?yàn)樗鼈儫o(wú)法測(cè)度內(nèi)容授權(quán)共享給對(duì)方帶來(lái)的間接流量收益,更擔(dān)心生成式AI企業(yè)將通過(guò)不斷學(xué)習(xí)優(yōu)質(zhì)數(shù)據(jù)而成為內(nèi)容生產(chǎn)者或生產(chǎn)鏈條上游的工具壟斷者,降低整個(gè)內(nèi)容服務(wù)市場(chǎng)的成本并占據(jù)競(jìng)爭(zhēng)優(yōu)勢(shì)。在雙方不同預(yù)期下,談判很容易破裂,即便大模型開(kāi)發(fā)者試圖以侵權(quán)促合作,也未必有好的效果。
導(dǎo)致生成式AI企業(yè)轉(zhuǎn)向私人控制語(yǔ)料庫(kù)的另一個(gè)原因是網(wǎng)絡(luò)空間中缺乏高質(zhì)量的公開(kāi)數(shù)據(jù),大量有價(jià)值的內(nèi)容和行為數(shù)據(jù)事實(shí)上由私人平臺(tái)持有。即使各級(jí)政府一直在推動(dòng)公共數(shù)據(jù)開(kāi)放,當(dāng)下也因財(cái)政問(wèn)題和數(shù)據(jù)安全擔(dān)憂而轉(zhuǎn)向更保險(xiǎn)的授權(quán)運(yùn)營(yíng)機(jī)制。早期互聯(lián)網(wǎng)的開(kāi)放生態(tài)和行業(yè)規(guī)范已逐漸存在轉(zhuǎn)向封閉和自我循環(huán)的傾向。由此不難理解,包括可能的大模型開(kāi)發(fā)者在內(nèi)的AI創(chuàng)業(yè)者不得不嘗試通過(guò)爬蟲(chóng)等方式獲取各類網(wǎng)絡(luò)數(shù)據(jù)用以開(kāi)發(fā)新技術(shù),而無(wú)論是否得到授權(quán)。這就和早期互聯(lián)網(wǎng)“非法興起”十分類似。但不同之處在于,早期“非法興起”得到的信息內(nèi)容經(jīng)過(guò)數(shù)字化轉(zhuǎn)換就可以直接變成免費(fèi)內(nèi)容在網(wǎng)上使用,并成為平臺(tái)商業(yè)模式的一部分;而生成式AI企業(yè)即使對(duì)語(yǔ)料庫(kù)進(jìn)行預(yù)訓(xùn)練,也并不意味著可以直接產(chǎn)生可預(yù)期的價(jià)值。這也導(dǎo)致現(xiàn)有語(yǔ)料庫(kù)平臺(tái)企業(yè)往往更愿意自己?jiǎn)为?dú)開(kāi)發(fā)大模型,提升已有服務(wù)的質(zhì)量,而較少和外部力量合作,更不可能想象會(huì)迅速取代已有服務(wù)?!纠纾袊?guó)知網(wǎng)依托大量學(xué)術(shù)研究論文開(kāi)發(fā)論文閱讀和分析的大模型服務(wù),而沒(méi)有和外部主體合作?!窟@個(gè)邏輯也是理解目前平臺(tái)企業(yè)間內(nèi)容流動(dòng)互聯(lián)互通無(wú)法實(shí)現(xiàn)的重要因素,即兩個(gè)成熟生態(tài)系統(tǒng)之間的要素交換難以定價(jià),依靠行政指令強(qiáng)制合作難以得到好的效果。
二、作為權(quán)益分配的司法裁判
如果我們相信生成式AI代表著未來(lái)人工智能模式發(fā)展的重要技術(shù)路徑,就會(huì)對(duì)大模型數(shù)據(jù)訓(xùn)練過(guò)程保持寬容,認(rèn)定數(shù)據(jù)訓(xùn)練過(guò)程并不會(huì)帶來(lái)直接可見(jiàn)損失,而一旦大模型訓(xùn)練成功則可以反過(guò)來(lái)惠及更多行業(yè)和開(kāi)發(fā)者,成為某種基礎(chǔ)設(shè)施甚至必需設(shè)施?!緩埩韬骸渡墒饺斯ぶ悄艿姆啥ㄎ慌c分層治理》,載《現(xiàn)代法學(xué)》2023年第4期。】在這種立場(chǎng)下,數(shù)據(jù)確權(quán)只會(huì)阻礙流動(dòng),只有發(fā)現(xiàn)存在對(duì)語(yǔ)料庫(kù)持有者造成明顯損害的行為時(shí)才需要追責(zé),甚至可以充分利用“避風(fēng)港規(guī)則”限定責(zé)任范圍,降低注意義務(wù)的成本?!就趵鳎骸渡墒饺斯ぶ悄芮謾?quán)的法律應(yīng)對(duì)》,載《中國(guó)應(yīng)用法學(xué)》2023年第5期。】這種思路實(shí)際上是一種責(zé)任規(guī)則,即在無(wú)法事先確定要素價(jià)格以及無(wú)法獲得要素持有人同意的情況下,由法院事后適用損害賠償,確定一個(gè)法定價(jià)格。另一種態(tài)度則是嚴(yán)格保護(hù)語(yǔ)料庫(kù)數(shù)據(jù)集的財(cái)產(chǎn)性利益,只有明確獲得授權(quán)才可以使用,且考慮到其建設(shè)投入的固定成本很高,要為侵權(quán)行為設(shè)定較高的注意義務(wù)標(biāo)準(zhǔn),主張按照通行市場(chǎng)價(jià)格(往往是壟斷定價(jià))進(jìn)行賠償。這是一種典型的財(cái)產(chǎn)規(guī)則思路。【Guido Calabresi, Douglas Melamed, Property Rules, Liability Rules and Inability Rules: One View of the Cathedral, Harvard Law Review, Vol. 85, No. 6, 1972.】
兩種思路都不乏支持者,如前所述,大模型開(kāi)發(fā)者極力呼吁責(zé)任規(guī)則,而語(yǔ)料庫(kù)持有者則保持觀望,希望落實(shí)財(cái)產(chǎn)規(guī)則,并試圖威懾其他潛在大模型開(kāi)發(fā)者不要輕舉妄動(dòng)。有趣的是,數(shù)據(jù)確權(quán)議題本身就是那些沒(méi)有能力獲得數(shù)據(jù)的企業(yè)提出的意識(shí)形態(tài)話語(yǔ),因?yàn)橹挥袑?shù)據(jù)權(quán)屬分散到個(gè)體,而不是控制個(gè)體數(shù)據(jù)的大型平臺(tái),個(gè)體才可能有動(dòng)力在各種誘惑和補(bǔ)貼下將數(shù)據(jù)進(jìn)行轉(zhuǎn)移(通過(guò)“一鍵搬家”軟件,實(shí)現(xiàn)“數(shù)據(jù)攜帶權(quán)”),從而降低創(chuàng)業(yè)成本。大型平臺(tái)在數(shù)據(jù)確權(quán)討論中從來(lái)都保持沉默,因?yàn)樗鼈兿胍牟⒎蔷唧w的數(shù)據(jù)要素確權(quán),而是整體性的架構(gòu)財(cái)產(chǎn)權(quán),目的是有效排除競(jìng)爭(zhēng)對(duì)手未經(jīng)許可即進(jìn)入架構(gòu)空間。【胡凌:《數(shù)字經(jīng)濟(jì)中的兩種財(cái)產(chǎn)權(quán):從要素到架構(gòu)》,載《中外法學(xué)》2021年第6期?!?/p>
因此問(wèn)題就變成了,從整體利益考量出發(fā),生成式AI產(chǎn)業(yè)需要何種規(guī)則才能更好地滿足社會(huì)需求,即不僅要把蛋糕做大,還要相對(duì)公平地分蛋糕。在科斯看來(lái),如果交易成本足夠低,將權(quán)益事先配置給哪一方問(wèn)題都不大,有價(jià)值的資源和技術(shù)自然會(huì)流轉(zhuǎn)至需要的市場(chǎng)主體手中?!緟⒁?jiàn)[美]羅納德·H.科斯:《社會(huì)成本問(wèn)題》,載《企業(yè)、市場(chǎng)與法律》,盛洪、陳郁譯校,格致出版社2014年版,第146頁(yè)?!烤蛿?shù)據(jù)要素市場(chǎng)而言也類似,只要生成式AI企業(yè)和語(yǔ)料庫(kù)企業(yè)有意愿進(jìn)行談判,就可以通過(guò)合作方式而非單純交易共同有效開(kāi)發(fā)這些數(shù)據(jù)。鑒于目前雙方很難就生成式AI使用高質(zhì)量語(yǔ)料庫(kù)的價(jià)格達(dá)成共識(shí),一旦發(fā)生侵權(quán)行為,法院設(shè)定的賠償標(biāo)準(zhǔn)就非常關(guān)鍵。如果無(wú)論如何都會(huì)發(fā)生非法方式獲取數(shù)據(jù)的侵權(quán)行為,責(zé)任規(guī)則和財(cái)產(chǎn)規(guī)則的差別實(shí)際上就成了損害賠償?shù)耐爻潭葐?wèn)題。如果賠償額度持續(xù)較高,則可能帶來(lái)高強(qiáng)度威懾,抑制潛在的大模型開(kāi)發(fā)者,降低行業(yè)活躍程度,也就更接近財(cái)產(chǎn)規(guī)則;如果賠償額度較低,威懾強(qiáng)度也隨之降低,行業(yè)更有動(dòng)力進(jìn)行嘗試,也就更接近責(zé)任規(guī)則。
這里主要涉及兩個(gè)層次的因素。首先是行為定性和發(fā)生概率。數(shù)據(jù)不正當(dāng)競(jìng)爭(zhēng)行為在互聯(lián)網(wǎng)行業(yè)并不少見(jiàn),經(jīng)過(guò)大約十年的積累和傳播,現(xiàn)有《反不正當(dāng)競(jìng)爭(zhēng)法》已經(jīng)完全可以涵蓋和規(guī)制,司法領(lǐng)域逐漸達(dá)成了共識(shí):未經(jīng)許可入侵架構(gòu)空間獲取資源要素的行為屬于不正當(dāng)競(jìng)爭(zhēng)。無(wú)論事后數(shù)據(jù)如何使用,只要使用爬蟲(chóng)或軟件外掛進(jìn)行數(shù)據(jù)轉(zhuǎn)移,就可以認(rèn)定為破壞了數(shù)字市場(chǎng)秩序。盡管法律對(duì)特定處罰行為尚沒(méi)有明確授權(quán),這一趨勢(shì)開(kāi)始擴(kuò)展到行政執(zhí)法領(lǐng)域?!?022年,浙江省杭州市監(jiān)局辦理了全國(guó)首例“搬店軟件”新型不正當(dāng)競(jìng)爭(zhēng)案,兩家涉案的科技公司以12元至699元不等的價(jià)格對(duì)外出售“搬店軟件”,累計(jì)爬取了2000萬(wàn)條數(shù)據(jù),被處罰140萬(wàn)元。2023年天津市監(jiān)局也辦理了類似案件。以往此類案件一般通過(guò)司法方式認(rèn)定不正當(dāng)競(jìng)爭(zhēng)進(jìn)行判罰?!康匾倪€不是定性,而是就賠償額度統(tǒng)一標(biāo)準(zhǔn),從而在司法領(lǐng)域和行業(yè)內(nèi)都形成可預(yù)期的行為尺度。這并不容易,各地法院很難短時(shí)間內(nèi)就要素價(jià)格標(biāo)準(zhǔn)達(dá)成共識(shí)。
其次是威懾強(qiáng)度。司法事實(shí)上需要做的并非選擇題,而是幫助確定一個(gè)合理價(jià)格。這意味著司法未必只有積極應(yīng)對(duì)才是對(duì)的,只要不過(guò)度妨礙大模型技術(shù)的開(kāi)發(fā),推動(dòng)市場(chǎng)調(diào)節(jié)可能會(huì)有更好的效果。一般而言,在此類案件中,判處侵權(quán)的賠償價(jià)格不僅應(yīng)低于作為原告的語(yǔ)料庫(kù)企業(yè)提出的天價(jià)賠償額度,也應(yīng)盡可能低于一個(gè)可能的壟斷市場(chǎng)價(jià)格。其目的不僅在于補(bǔ)償原告過(guò)去的投入及確定賠償標(biāo)準(zhǔn),同時(shí)也表達(dá)了對(duì)新技術(shù)研發(fā)可能失敗的鼓勵(lì)甚至獎(jiǎng)勵(lì)。如果社會(huì)想要一直向前,就不得不容忍新技術(shù)帶來(lái)的一定程度的破壞性??吹剿痉ú⒉辉噲D主動(dòng)干預(yù),雙方當(dāng)事人才有可能重新思考行動(dòng)策略:要么原告試圖和解,并收取略高于賠償金的價(jià)格達(dá)成合作,這也是被告可以接受的;要么原告采取自我防御的技術(shù)措施,防止爬蟲(chóng)爬取,或者自行開(kāi)發(fā)大模型,將社會(huì)成本內(nèi)化。
三、生成式AI的商業(yè)模式
司法裁判在確定賠償數(shù)額時(shí),也可以考慮生成式AI展示出的不同類型的商業(yè)模式,進(jìn)而理解它們對(duì)法律制度供給的不同需求。目前,除了AI內(nèi)容生成需要受到監(jiān)管外,對(duì)模型訓(xùn)練內(nèi)容的合法性也有一定約束。【參見(jiàn)《生成式人工智能服務(wù)管理暫行辦法》第7條?!空Z(yǔ)詞表達(dá)本身決定了我們看待特定技術(shù)應(yīng)用的不同面向。如果我們使用“生成式”,表達(dá)的實(shí)際上是生成內(nèi)容為主的AI服務(wù),而“大模型”則是任何一種服務(wù)背后的算法設(shè)計(jì),其使用潛力未必僅限于內(nèi)容生產(chǎn)。機(jī)器學(xué)習(xí)和數(shù)據(jù)訓(xùn)練從外部觀察視角看來(lái)只是一個(gè)黑箱內(nèi)部的技術(shù)環(huán)節(jié),只有在成熟的平臺(tái)服務(wù)模式下才顯示出其能力,這必須依托一個(gè)服務(wù)形式觸及用戶才能做到。用戶在意的也并非單純的內(nèi)容生成,少有人會(huì)無(wú)聊到時(shí)時(shí)和機(jī)器聊天,或者僅為了生成有趣圖片而持續(xù)使用大模型,而是會(huì)尋求多元的應(yīng)用目標(biāo)。因此,只有在現(xiàn)有服務(wù)基礎(chǔ)上的生成式應(yīng)用才更實(shí)際一些,既能滿足用戶的創(chuàng)造欲望,又可以生產(chǎn)出更多可供消費(fèi)的多樣性服務(wù)。這也意味著生成式AI盡管生產(chǎn)能力極大增強(qiáng),自身卻未必能單獨(dú)產(chǎn)生新的穩(wěn)定模式。
我們可以通過(guò)光譜方式對(duì)可能的商業(yè)模式大致加以展示。第一,對(duì)于已經(jīng)擁有語(yǔ)料庫(kù)內(nèi)容的平臺(tái)企業(yè)而言,可以逐漸加大AI生成工具介入的程度,輔助人類用戶創(chuàng)作,讓用戶內(nèi)容更加豐富多元。但這可能也會(huì)導(dǎo)致一些生產(chǎn)者抵制機(jī)器生產(chǎn)(如繪畫領(lǐng)域),為了繼續(xù)獲取流量,平臺(tái)不得不作出妥協(xié)。第二,對(duì)于獨(dú)立的生成式AI企業(yè)而言,可以模仿既有平臺(tái)模式依靠用戶使用AI軟件生產(chǎn),但約定用戶生成作品需要發(fā)布在特定封閉平臺(tái)內(nèi)供其他用戶學(xué)習(xí)交流,也可以采取會(huì)員制。AI企業(yè)在其中僅起到組織生產(chǎn)的功能,但也需要對(duì)內(nèi)容合法性承擔(dān)一定的注意義務(wù)。第三,生成式AI企業(yè)可以出租或出售軟件,約定由用戶成為特定作品的創(chuàng)作主體,因此一切使用該軟件的行為都是用戶個(gè)人行為,傳播和發(fā)布完全由用戶本人負(fù)責(zé)。這種模式目前在行業(yè)發(fā)展初期較為常見(jiàn),即企業(yè)試圖避免擔(dān)責(zé),從而放棄可能的AI作品收益。第四,生成式AI企業(yè)全自動(dòng)生產(chǎn)成為內(nèi)容服務(wù)提供者,這種模式下自然會(huì)主張獨(dú)立的創(chuàng)作者地位,用戶只能訂閱瀏覽,但不能傳播或再創(chuàng)作。我們尚未看到最后一種全新機(jī)器生產(chǎn)模式的大規(guī)模普及,盡管法律和政策分析多是以此為前提的。
如果生成式AI沒(méi)能構(gòu)成一個(gè)全新的生產(chǎn)方式,只是某些無(wú)法預(yù)知未來(lái)的新技術(shù),甚至無(wú)法成為基礎(chǔ)設(shè)施,那么法律進(jìn)行特別傾斜保障的理由似乎就變?nèi)趿?。從歷史上看,互聯(lián)網(wǎng)“非法興起”的意義就在于實(shí)現(xiàn)了針對(duì)工業(yè)化生產(chǎn)方式在組織意義上的突破,但生成式AI如果在現(xiàn)有平臺(tái)模式基礎(chǔ)上延伸,就會(huì)受到當(dāng)下保護(hù)既有平臺(tái)利益的法律規(guī)則的約束。但同時(shí)也要注意到,“非法興起”并非一個(gè)應(yīng)然狀態(tài),而是數(shù)字經(jīng)濟(jì)創(chuàng)新突破的實(shí)然解釋,我們只有在一項(xiàng)技術(shù)和模式成熟的情況下才意識(shí)到之前的若干政策措施做對(duì)了,才可能回過(guò)頭去總結(jié)經(jīng)驗(yàn),盡管對(duì)未來(lái)也未必管用。這是否意味著司法裁判應(yīng)當(dāng)且不得不采取一種無(wú)為態(tài)度?
如果更加細(xì)致地分析,以下幾個(gè)因素決定了,至少在當(dāng)前生成式AI侵權(quán)場(chǎng)景下,責(zé)任規(guī)則可以廣為適用且負(fù)外部性不大。
第一,模型訓(xùn)練是整個(gè)生成式AI開(kāi)發(fā)的關(guān)鍵環(huán)節(jié),但從開(kāi)發(fā)到落地還有其他眾多環(huán)節(jié),使用財(cái)產(chǎn)規(guī)則認(rèn)定侵權(quán)并施加高損害賠償既超越了利益雙方認(rèn)知,也不會(huì)帶來(lái)任何實(shí)際好處。第二,中國(guó)的情況和美國(guó)以ChatGPT和LaMDA為首的市場(chǎng)結(jié)構(gòu)不同,率先開(kāi)發(fā)大模型的企業(yè)并未具有突出的競(jìng)爭(zhēng)優(yōu)勢(shì),且大模型開(kāi)發(fā)者較少掌握高質(zhì)量語(yǔ)料庫(kù),短時(shí)間內(nèi)沒(méi)有反競(jìng)爭(zhēng)的跡象,也不會(huì)出現(xiàn)非常明顯的無(wú)序爬取大量數(shù)據(jù)的不正當(dāng)競(jìng)爭(zhēng)。第三,有能力投入大模型開(kāi)發(fā)的都是實(shí)力雄厚的大企業(yè),它們之間的糾紛爭(zhēng)議可以限制在一定范圍內(nèi)不會(huì)擴(kuò)大。其行為模式分別是:對(duì)于大模型開(kāi)發(fā)者,除非必要,一般不會(huì)投資過(guò)多以購(gòu)買很多分散的語(yǔ)料庫(kù),因?yàn)樾略鰡我徽Z(yǔ)料庫(kù)僅僅是在邊際上改善,無(wú)法看出對(duì)大模型功能的明顯提升,只要能通過(guò)大模型招牌成功吸引合作者圈地即可。這解釋了為何大量不成熟的大模型產(chǎn)品紛紛發(fā)布,哪怕面臨監(jiān)管風(fēng)險(xiǎn)。對(duì)于語(yǔ)料庫(kù)持有者,它們會(huì)自己開(kāi)發(fā)大模型,并嚴(yán)格保護(hù)自己的數(shù)據(jù),且有能力游說(shuō)政府進(jìn)行監(jiān)管處罰。因此,提出生成式AI侵權(quán)議題的可能更多是大型企業(yè),只要考慮到算力成本就可以理解中小企業(yè)基本上不太可能加入這場(chǎng)論辯。第四,盡管就大模型應(yīng)用落地還很難在全社會(huì)范圍內(nèi)達(dá)成共識(shí),特別是個(gè)體生產(chǎn)者往往擔(dān)心自己被取代,但已經(jīng)有行業(yè)協(xié)會(huì)(如文著協(xié))牽頭同大模型開(kāi)發(fā)者進(jìn)行交流討論,這就意味著兩個(gè)利益群體及其代理人之間的協(xié)調(diào)總體可控。
四、結(jié)語(yǔ)
本文并不試圖對(duì)未來(lái)進(jìn)行預(yù)測(cè),也不站隊(duì),而是從司法裁判層面出發(fā),簡(jiǎn)要分析為何責(zé)任規(guī)則在處理生成式AI侵權(quán)糾紛中可能更為合適。我們已經(jīng)看到行業(yè)資源在不斷整合與合作,一起把蛋糕做大。責(zé)任規(guī)則的好處不在于保證那些率先投入的企業(yè)能真正獲得低成本的資源,而是留出可能的創(chuàng)新空間,并引導(dǎo)社會(huì)既得利益者向該領(lǐng)域投入更多,最終帶動(dòng)整個(gè)行業(yè)轉(zhuǎn)型,施惠于整個(gè)社會(huì)。相較于財(cái)產(chǎn)規(guī)則,責(zé)任規(guī)則可能更加適應(yīng)這個(gè)時(shí)代的變化,并推動(dòng)可能的創(chuàng)新。
本文尚未深入觸及的問(wèn)題是分配,即帶來(lái)強(qiáng)大生產(chǎn)能力的生成式AI是否最終能推動(dòng)更有價(jià)值和高效的生產(chǎn),從而降低所有社會(huì)成員的生活與工作成本,并給那些被取代的潛在勞動(dòng)者以合理回饋和補(bǔ)償,繼續(xù)處理好個(gè)體勞動(dòng)者和平臺(tái)企業(yè)的關(guān)系,無(wú)論這種平臺(tái)是語(yǔ)料庫(kù)持有者還是大模型開(kāi)發(fā)者。
[責(zé)任編輯 榮圓夢(mèng)]