[摘 要]以Sora、Midjourney、Stable Diffusion為代表的文生圖像類(lèi)人工智能的多元應(yīng)用,賦予人工智能生成圖像訓(xùn)練數(shù)據(jù)侵權(quán)、版權(quán)沖突、知識(shí)產(chǎn)權(quán)定位等問(wèn)題新的討論意蘊(yùn)。文生圖像類(lèi)人工智能涉及的知識(shí)產(chǎn)權(quán)侵犯風(fēng)險(xiǎn)包括訓(xùn)練數(shù)據(jù)構(gòu)成潛在侵權(quán)、知識(shí)產(chǎn)權(quán)歸屬尚未明晰、商業(yè)應(yīng)用擴(kuò)大侵權(quán)規(guī)模三個(gè)方面。通過(guò)強(qiáng)化圖像的獨(dú)特性與可溯源性、完善侵權(quán)責(zé)任認(rèn)定與承擔(dān)規(guī)制、增進(jìn)行業(yè)自律與版權(quán)知識(shí)普及等治理手段,可有效治理前述知識(shí)產(chǎn)權(quán)侵犯風(fēng)險(xiǎn),共同推動(dòng)文生圖像類(lèi)人工智能的合規(guī)、高效與可持續(xù)發(fā)展。
[關(guān)鍵詞]文生圖像類(lèi)人工智能;知識(shí)產(chǎn)權(quán);版權(quán)歸屬;風(fēng)險(xiǎn)治理
[中圖分類(lèi)號(hào)]F204 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1671-8372(2024)04-0095-09
Risks of intellectual property infringement in AI for Text-to-Image Generation and governance approaches
GUO Yan-long1,2,LI Meng2,ZHU Ye-lin3
(1. School of Art,Xinjiang Hetian College,Hetian 848000,China;2. School of Art,Anhui University,Hefei 230601,China;3. School of Information Management,Wuhan University,Wuhan 430072,China)
Abstract:The diverse applications of AI for Text-to-Image Generation,represented by Sora,Midjourney,and Stable Diffusion,have brought new perspectives to discussions about issues such as training data infringement,copyright conflicts,and the positioning of intellectual property. The intellectual property risks associated with AI for Text-to-Image Generation include potential infringement in the composition of training data,unclear attribution of intellectual property rights,and the expansion of infringement through commercial applications. To effectively address these risks,measures such as enhancing the uniqueness and traceability of images,improving the regulation of infringement liability and responsibility,and promoting industry self-regulation and copyright awareness can help foster the compliant,efficient,and sustainable development of AI for Text-to-Image Generation.
Key words:AI for Text-to-Image Generation;intellectual property rights;ownership of copyright;risk management
一、引言
自ChatGPT以文衍文,至Midjourney以文生圖,再到Runway、Pika、Sora以文生視頻,人工智能的工具能力日益延展。如果說(shuō)ChatGPT的發(fā)布揭開(kāi)了通用人工智能時(shí)代的帷幕,那么以Sora、Midjourney、Stable Diffusion為代表的文生圖像類(lèi)人工智能(Text-to-Image AI)的推出,不僅重塑了內(nèi)容創(chuàng)作的邊界,為藝術(shù)創(chuàng)作、設(shè)計(jì)創(chuàng)新乃至信息傳播帶來(lái)了前所未有的變革,也意味著人工智能的理解能力與生成能力得到了質(zhì)的飛躍[1]。文生圖像類(lèi)人工智能使人類(lèi)的創(chuàng)作方式產(chǎn)生改變,而此改變必將對(duì)激勵(lì)與尊重人類(lèi)創(chuàng)造力的知識(shí)產(chǎn)權(quán)體系提出挑戰(zhàn)。自長(zhǎng)遠(yuǎn)觀之,知識(shí)產(chǎn)權(quán)體系何以應(yīng)對(duì)此類(lèi)挑戰(zhàn),或?qū)?duì)生成式人工智能系統(tǒng)的演進(jìn)軌跡,乃至未來(lái)人類(lèi)的創(chuàng)造圖景產(chǎn)生深遠(yuǎn)影響。
于此演進(jìn)過(guò)程中,文生圖像類(lèi)人工智能需深度學(xué)習(xí)、處理與分析海量既有作品,進(jìn)而生成既真切又富有想象力的圖像內(nèi)容。文生圖像類(lèi)人工智能雖極大降低了圖像創(chuàng)作的技術(shù)門(mén)檻與經(jīng)濟(jì)成本,然亦使原創(chuàng)與摹制的界限趨于模糊,對(duì)傳統(tǒng)基于“人類(lèi)創(chuàng)作”構(gòu)建的知識(shí)產(chǎn)權(quán)保護(hù)體系造成潛在侵犯風(fēng)險(xiǎn)[2]。此外,人工智能生成的圖像作品亦有遭受侵權(quán)的情況。例如北京互聯(lián)網(wǎng)法院所裁“AI文生圖”著作權(quán)侵權(quán)案中,原告李某使用開(kāi)源軟件Stable Diffusion生成涉案圖片,并在社交平臺(tái)上發(fā)布時(shí)明確標(biāo)注“AI插畫(huà)”“AI繪畫(huà)”等標(biāo)簽。隨后,此圖被劉某用作詩(shī)文配圖發(fā)布,且未帶署名水印。李某認(rèn)為其署名權(quán)與信息網(wǎng)絡(luò)傳播權(quán)遭受侵犯,遂訴至法院。法院終裁劉某構(gòu)成侵權(quán),判令其向李某書(shū)面致歉,并賠償損失。本案中,Stable Diffusion生成的圖片未經(jīng)授權(quán)而被擅用,遂致知識(shí)產(chǎn)權(quán)糾紛。此凸顯文生圖像類(lèi)人工智能在應(yīng)用過(guò)程中亟須解決的核心法律問(wèn)題,亦是目前諸多國(guó)家面臨的共同難題[3]。如何界定由算法生成的圖像作品的原創(chuàng)性?其創(chuàng)作過(guò)程中可能涉及的版權(quán)、商標(biāo)權(quán)乃至肖像權(quán)等知識(shí)產(chǎn)權(quán)侵權(quán)風(fēng)險(xiǎn)又應(yīng)如何評(píng)估與防范?
當(dāng)下,知識(shí)產(chǎn)權(quán)遭受生成式人工智能工具侵犯的風(fēng)險(xiǎn)隱患是普遍存在的,且相關(guān)探討已經(jīng)較多。蔡琳等認(rèn)為,為了清晰界定生成式人工智能著作權(quán)法中的保護(hù)路徑,并為其出版、發(fā)行與商業(yè)交易等新興版權(quán)形態(tài)提供制度框架與支撐,應(yīng)加速立法進(jìn)程,重新構(gòu)建著作權(quán)法中的作品分類(lèi)體系,并增設(shè)生成式人工智能“作品”作為法定類(lèi)別[4]。徐小奔等認(rèn)為,在維持生成式人工智能工具屬性的前提下,遵循“技術(shù)中立”原則,為生成式人工智能服務(wù)供應(yīng)商設(shè)定恰當(dāng)?shù)陌鏅?quán)注意事項(xiàng)[5]。張吉豫等認(rèn)為,著作權(quán)法在人工智能時(shí)代必須主動(dòng)適應(yīng)技術(shù)發(fā)展趨勢(shì),構(gòu)建與當(dāng)前社會(huì)產(chǎn)業(yè)發(fā)展相契合的合理使用規(guī)范[6]。然而這些討論多以宏觀視角聚焦于生成式人工智能生成文本的可版權(quán)性、著作權(quán)倫理等領(lǐng)域,缺少對(duì)于“文生圖像”的針對(duì)性探討。有鑒于此,本文旨在深入剖析文生圖像類(lèi)人工智能的概念內(nèi)核、運(yùn)行機(jī)理及其生成內(nèi)容的獨(dú)特屬性,進(jìn)而從技術(shù)革新、法律規(guī)制與社會(huì)審視三個(gè)維度剖析文生圖像類(lèi)人工智能引發(fā)的知識(shí)產(chǎn)權(quán)侵犯風(fēng)險(xiǎn),并探索構(gòu)建適應(yīng)智能時(shí)代需求的知識(shí)產(chǎn)權(quán)保護(hù)新路徑,以期在鼓勵(lì)創(chuàng)新與保障權(quán)益之間尋得平衡。
二、文生圖像類(lèi)人工智能的理論邏輯及其生成內(nèi)容特征
(一)文生圖像類(lèi)人工智能的界定
從廣義概念來(lái)說(shuō),圖像包括靜態(tài)圖片與動(dòng)態(tài)影像。靜態(tài)圖片是圖像在某時(shí)刻的靜態(tài)呈現(xiàn),而動(dòng)態(tài)影像則是圖像在時(shí)間維度上的連續(xù)展示,兩者共同構(gòu)成了人類(lèi)對(duì)世界的視覺(jué)感知和認(rèn)知體系。美國(guó)視覺(jué)研究領(lǐng)域杰出的理論家W. J. T. 米切爾(W. J. T. Mitchel)在其著作《圖像理論》(The Theory of Images)中,對(duì)圖像的概念進(jìn)行了廣泛的探討。米切爾認(rèn)為,圖像不僅是視覺(jué)的再現(xiàn),更是文化、權(quán)力和知識(shí)的載體[7]。他將圖像視為傳遞和構(gòu)建意義的“媒介”,而影像作為動(dòng)態(tài)的圖像形式,同樣具備這種能力。
以Sora、Midjourney、Stable Diffusion為代表的文生圖像類(lèi)人工智能并非自然發(fā)展的產(chǎn)物,亦非純粹思辨的結(jié)果,而是時(shí)代發(fā)展和科技進(jìn)步的產(chǎn)物。文生圖像類(lèi)人工智能借以深度學(xué)習(xí)算法,特別是生成對(duì)抗網(wǎng)絡(luò)(GANs)及其衍生模型的優(yōu)化,使得智能機(jī)器能夠厘析人類(lèi)輸入的文本描述,生成與之相契合、富有創(chuàng)意與視覺(jué)魅力的圖像[8]。具體而言,此項(xiàng)技術(shù)不同于此前單一的文本至文本的轉(zhuǎn)換,而是開(kāi)始探索與圖片、視頻輸出模態(tài)的交互與融合,使用者輸入文字和語(yǔ)言指令,便可自動(dòng)生成所需的圖片和視頻[9]。例如OpenAI的DALL·E能夠根據(jù)用戶(hù)輸入的文本描述生成與之相匹配的圖像內(nèi)容。DALL·E生成的圖像不僅具有高度的真實(shí)性和多樣性,亦可實(shí)現(xiàn)跨模態(tài)的創(chuàng)意融合,使用者可將不同風(fēng)格的圖像元素進(jìn)行組合和拼接,進(jìn)而生成全新的圖像作品。這彰顯了其在處理與理解復(fù)雜視覺(jué)信息方面的卓越能力,更預(yù)示著文生圖像類(lèi)人工智能在廣告、影視等創(chuàng)意產(chǎn)業(yè)的廣泛普及與深度融合[10]。在傳統(tǒng)模式下,影視制作與廣告營(yíng)銷(xiāo)高度依賴(lài)人工操作,耗時(shí)長(zhǎng)、成本高,且對(duì)創(chuàng)意與資源的要求極為苛刻。然而,文生圖像類(lèi)人工智能的發(fā)展為這些行業(yè)帶來(lái)機(jī)遇與變革,其能夠基于數(shù)據(jù)分析,理解目標(biāo)受眾的偏好與需求,從而生成符合市場(chǎng)趨勢(shì)與品牌調(diào)性的圖像內(nèi)容。這種基于數(shù)據(jù)驅(qū)動(dòng)的創(chuàng)意生產(chǎn)方式,既提升了廣告的傳播效果,亦為市場(chǎng)營(yíng)銷(xiāo)策略的制定提供了更為科學(xué)的依據(jù)。企業(yè)能夠借此技術(shù)優(yōu)化資源配置,加速內(nèi)容產(chǎn)出,提升市場(chǎng)競(jìng)爭(zhēng)力。
總體而言,文生圖像類(lèi)人工智能作為人工智能領(lǐng)域的一項(xiàng)前沿技術(shù),為人類(lèi)探索和理解圖像與語(yǔ)言之間的復(fù)雜關(guān)系提供了新的視角和工具。然而伴隨技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的相繼拓展,其中蘊(yùn)含的潛在風(fēng)險(xiǎn)和現(xiàn)實(shí)挑戰(zhàn)亦相繼顯現(xiàn),為更有效引導(dǎo)文生圖像類(lèi)人工智能服務(wù)于經(jīng)濟(jì)社會(huì)發(fā)展與創(chuàng)意產(chǎn)業(yè)升級(jí),深入剖析文生圖像類(lèi)人工智能的內(nèi)在運(yùn)行機(jī)理尤為重要。
(二)文生圖像類(lèi)人工智能的運(yùn)行機(jī)理
由文生圖像類(lèi)人工智能的界定可知,Sora、Midjourney、Stable Diffusion等文生圖像類(lèi)人工智能是一種將文字描述轉(zhuǎn)換成圖片、影像內(nèi)容的技術(shù),其依托于深度學(xué)習(xí)機(jī)制與網(wǎng)絡(luò)學(xué)習(xí)技術(shù),探賾文字描述和圖像內(nèi)容之間復(fù)雜而微妙的映射關(guān)系,進(jìn)而生成具有良好視覺(jué)效果的圖像作品[11]。其運(yùn)行機(jī)理主要表現(xiàn)在文本輸入與處理、文本編碼與特征提取、多模態(tài)融合與圖像生成以及圖像優(yōu)化與輸出四個(gè)方面。
一是文本輸入與處理。作為整個(gè)流程的起點(diǎn),文本輸入與處理涉及深度語(yǔ)言理解、信息提取與結(jié)構(gòu)化技術(shù)挑戰(zhàn)。文生圖像類(lèi)人工智能的文本輸入具有多樣性,這種多樣性不僅體現(xiàn)在語(yǔ)言種類(lèi)上,如中文、英文、法文等多語(yǔ)種的支持,亦體現(xiàn)在文本內(nèi)容的豐富性上,包括描摹物態(tài)、敘述故事、抒發(fā)情感、引述術(shù)語(yǔ)等。為應(yīng)對(duì)文本輸入的多樣性,系統(tǒng)須具備強(qiáng)大的文本解析能力,能夠精準(zhǔn)辨識(shí)并解析不同語(yǔ)言、不同風(fēng)格以及包含特殊符號(hào)的文本輸入。這通常涉及自然語(yǔ)言處理中的分詞、詞性標(biāo)注、命名實(shí)體識(shí)別等預(yù)處理技術(shù)。在解析過(guò)程中,系統(tǒng)還會(huì)進(jìn)行文本清洗,剔除冗余的噪聲數(shù)據(jù),如標(biāo)點(diǎn)符號(hào)、空格等,以及糾正明顯的拼寫(xiě)和語(yǔ)法錯(cuò)誤,為后續(xù)的處理提供干凈、有序的數(shù)據(jù)基礎(chǔ)。繼而,文本處理環(huán)節(jié)深入到文本的語(yǔ)義層面。經(jīng)過(guò)清洗的文本需被轉(zhuǎn)譯為計(jì)算機(jī)能夠理解的數(shù)值向量。此過(guò)程不再停留于字面解析,而是深入文本的深層含義。現(xiàn)代技術(shù)通常采用預(yù)訓(xùn)練的語(yǔ)言模型,如BERT、GPT等對(duì)文本進(jìn)行轉(zhuǎn)譯。這些模型通過(guò)在大規(guī)模語(yǔ)料庫(kù)上的訓(xùn)練,能夠捕捉詞匯之間的語(yǔ)義關(guān)系和上下文信息,生成富含意蘊(yùn)的文本向量。
二是文本編碼與特征提取。文本編碼是文本到圖像映射的關(guān)鍵環(huán)節(jié)之一。傳統(tǒng)的文本編碼方法如詞袋模型(Bag of Words,BoW)、TF-IDF等雖簡(jiǎn)單易行,然卻存在維度災(zāi)難、語(yǔ)義鴻溝等弊端,難以準(zhǔn)確表達(dá)文本中的語(yǔ)義信息。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于神經(jīng)網(wǎng)絡(luò)的文本編碼方法逐漸成為主流[12]。特征提取則是從編碼后的文本向量中挖掘出對(duì)圖像生成有用的關(guān)鍵信息的過(guò)程。特征提取的目的在于將文本中的抽象概念、情感色彩、關(guān)鍵信息等,轉(zhuǎn)化為圖像生成算法能夠理解和利用的具體參數(shù)或指令。此過(guò)程需借助多種技術(shù)手段,如注意力機(jī)制、知識(shí)圖譜等。其中,注意力機(jī)制能夠幫助模型在文本編碼過(guò)程中關(guān)注那些對(duì)圖像生成至關(guān)重要的部分。知識(shí)圖譜則能夠?qū)⑽谋局械母拍?、?shí)體和關(guān)系映射到一個(gè)結(jié)構(gòu)化的知識(shí)庫(kù)中,為圖像生成提供豐富的背景信息和上下文支持。
三是多模態(tài)融合與圖像生成。多模態(tài)融合是指將來(lái)自不同傳感器、不同模態(tài)的信息進(jìn)行整合的一項(xiàng)技術(shù)。在文生圖像領(lǐng)域,多模態(tài)融合關(guān)注如何將文本描述與圖像生成過(guò)程相結(jié)合。為了實(shí)現(xiàn)文本與圖像之間的有效關(guān)聯(lián),需要進(jìn)行跨模態(tài)對(duì)齊與融合。這包括將文本向量與圖像特征進(jìn)行匹配、拼接或利用注意力機(jī)制進(jìn)行融合,以確保生成的圖像能夠準(zhǔn)確反映文本描述的意圖和細(xì)節(jié)。圖像生成是文生圖像類(lèi)人工智能的核心環(huán)節(jié),負(fù)責(zé)將文本描述轉(zhuǎn)化為具體的視覺(jué)內(nèi)容。為實(shí)現(xiàn)高質(zhì)量的圖像生成,系統(tǒng)通常會(huì)采用生成對(duì)抗網(wǎng)絡(luò)、變分自編碼器等生成模型。這些模型通過(guò)在大規(guī)模數(shù)據(jù)集上進(jìn)行訓(xùn)練,學(xué)習(xí)如何根據(jù)輸入的文本描述來(lái)生成與之對(duì)應(yīng)的圖像。在生成過(guò)程中,模型會(huì)不斷迭代和優(yōu)化,以產(chǎn)生更加逼真、更加符合文本描述的圖像。為了提升圖像生成的多樣性和創(chuàng)新性,系統(tǒng)還會(huì)采用一些特殊的技術(shù)手段,如隨機(jī)噪聲的引入、條件約束的放寬等。這些手段使得生成的圖像在保持與文本描述一致性的同時(shí),能夠展現(xiàn)出獨(dú)特的風(fēng)格和創(chuàng)意[13]。
四是圖像優(yōu)化與輸出。在文生圖像類(lèi)人工智能運(yùn)行機(jī)理中,圖像優(yōu)化與輸出決定了最終生成圖像的質(zhì)量與適用性。圖像優(yōu)化是一個(gè)綜合性的過(guò)程,涵蓋多方面的調(diào)整與改善。首先,色彩管理是關(guān)鍵,通過(guò)校正圖像的色彩平衡、對(duì)比度和飽和度,確保圖像在不同顯示設(shè)備上都能呈現(xiàn)一致且自然的色彩效果。其次,壓縮技術(shù)被廣泛用于減少圖像文件的大小,同時(shí)盡量保持視覺(jué)質(zhì)量的可接受水平。常見(jiàn)的壓縮方法包括有損壓縮(如JPEG)和無(wú)損壓縮(如PNG、GIF),選擇何種方式取決于圖像類(lèi)型、所需質(zhì)量及最終用途。圖像輸出的過(guò)程是將優(yōu)化后的圖像以符合需求的形式呈現(xiàn)出來(lái)的最后一步。這包括選擇合適的文件格式、分辨率和色彩模式。文件格式的選擇應(yīng)基于圖像的用途和受眾設(shè)備,例如,對(duì)于網(wǎng)頁(yè)圖像,通常會(huì)選擇JPEG或WebP格式以?xún)?yōu)化加載速度。分辨率的設(shè)置同樣重要,其決定了圖像在不同尺寸下的清晰度,需要根據(jù)最終顯示或打印設(shè)備的分辨率來(lái)合理設(shè)置。在圖像輸出時(shí),需注意色彩空間的轉(zhuǎn)換。不同的顯示設(shè)備和打印設(shè)備支持不同的色彩空間,為了確保圖像在不同環(huán)境下都能呈現(xiàn)準(zhǔn)確的色彩,需要在輸出前將圖像的色彩空間轉(zhuǎn)換為與目標(biāo)設(shè)備相匹配的格式。例如,對(duì)于Web圖像,通常會(huì)將其從廣色域色彩空間(如Adobe RGB)轉(zhuǎn)換為sRGB色彩空間,以確保在大多數(shù)瀏覽器和顯示器上能正確顯示。
(三)文生圖像類(lèi)人工智能的生成內(nèi)容特征
不同于文生文類(lèi)人工智能,文生圖像類(lèi)人工智能主要基于圖像生成技術(shù),將文本描述轉(zhuǎn)換為具體的圖片與影像內(nèi)容,實(shí)現(xiàn)從描述性文字到視覺(jué)圖像的跨越。其生成內(nèi)容深刻而多維,更在技術(shù)與藝術(shù)的融合中探索著新的可能性。文生圖像類(lèi)人工智能生成內(nèi)容的特征主要表現(xiàn)在三個(gè)方面。
一是卓越的多樣性與創(chuàng)新性。文生圖像類(lèi)人工智能生成內(nèi)容的多樣性不僅體現(xiàn)在圖像類(lèi)型的廣泛覆蓋,如風(fēng)景畫(huà)、肖像畫(huà)、建筑設(shè)計(jì)圖、流程圖乃至復(fù)雜的視頻制作、廣告營(yíng)銷(xiāo)等,更在于其能夠捕捉并再現(xiàn)人類(lèi)創(chuàng)作中的細(xì)膩情感和獨(dú)特視角。在傳統(tǒng)意義上,圖像的創(chuàng)作依賴(lài)于藝術(shù)家與設(shè)計(jì)師的靈感、技藝與耗時(shí)良久的創(chuàng)作。而今,通過(guò)文生圖像類(lèi)人工智能,僅需簡(jiǎn)短的文本描述,便可激發(fā)人工智能的創(chuàng)造力,進(jìn)而生成風(fēng)格迥異、富有表現(xiàn)力的圖像作品。在創(chuàng)新性方面,文生圖像類(lèi)人工智能在內(nèi)容創(chuàng)作上不受傳統(tǒng)創(chuàng)作規(guī)范的束縛,能夠融合多種藝術(shù)風(fēng)格和元素,創(chuàng)造出嶄新的圖像樣式[14]。例如,利用Midjourney這樣的文生圖像類(lèi)人工智能,用戶(hù)通過(guò)輸入特定的風(fēng)格化命令,便可輕松生成具有較高水準(zhǔn)的作品。這些作品在保留原始文本描述的精神內(nèi)核的同時(shí),拓展圖像創(chuàng)作的邊界,可以在視覺(jué)上呈現(xiàn)出令人贊嘆的創(chuàng)意和美感。
二是高度的智能化與個(gè)性化。智能化主要體現(xiàn)在文生圖像類(lèi)人工智能對(duì)海量數(shù)據(jù)的深度學(xué)習(xí)與理解上。文生圖像類(lèi)人工智能通過(guò)分析海量的文本、圖像數(shù)據(jù),掌握了人類(lèi)創(chuàng)作的規(guī)律和技巧,從而能夠生成高質(zhì)量、符合人類(lèi)審美需求的圖像內(nèi)容。同時(shí),隨著技術(shù)的不斷進(jìn)步,文生圖像類(lèi)人工智能還能夠根據(jù)用戶(hù)反饋進(jìn)行自我優(yōu)化和迭代,以提升生成內(nèi)容的質(zhì)量和多樣性。個(gè)性化則是文生圖類(lèi)人工智能生成內(nèi)容的另一大亮點(diǎn)。傳統(tǒng)層面的內(nèi)容創(chuàng)作常受限于創(chuàng)作者的個(gè)人經(jīng)驗(yàn)與想象力,而文生圖像類(lèi)人工智能則能夠根據(jù)不同用戶(hù)的需求和偏好,生成個(gè)性化的圖像內(nèi)容。無(wú)論是商業(yè)廣告、個(gè)人定制藝術(shù)品抑或教育課件插圖,文生圖像類(lèi)人工智能均能根據(jù)用戶(hù)具體要求進(jìn)行靈活調(diào)整與優(yōu)化,滿(mǎn)足用戶(hù)的個(gè)性化需求[15]。值得注意的是,雖然上述的智能化與個(gè)性化特征源于人類(lèi)提供的數(shù)據(jù)和算法模型,但文生圖像類(lèi)人工智能通過(guò)深度學(xué)習(xí)和自我優(yōu)化,已能夠在一定程度上超越人類(lèi)的預(yù)設(shè)框架,創(chuàng)造出令人意想不到的圖像作品。此種超越體現(xiàn)了人工智能在內(nèi)容創(chuàng)作上的潛力和價(jià)值,同時(shí)引發(fā)了人們對(duì)于人工智能和人類(lèi)創(chuàng)造力之間關(guān)系的深刻審思。
三是良好的細(xì)節(jié)表現(xiàn)力。通過(guò)深度學(xué)習(xí)算法和海量訓(xùn)練數(shù)據(jù),文生圖像類(lèi)人工智能能夠捕捉到圖像中的細(xì)微之處,包括色彩、光影、紋理等,從而生成仿真度高、細(xì)節(jié)豐富的圖像。文生圖像類(lèi)人工智能注重圖像的整體結(jié)構(gòu)和布局,更深入每處細(xì)節(jié)之中,通過(guò)精細(xì)的筆觸與色彩搭配,將圖像中的諸多元素刻畫(huà)得栩栩如生。無(wú)論是人物的表情、服飾的褶皺,還是景物的遠(yuǎn)近層次、光影的明暗變化,都被賦予了鮮活的生命力。這種高精度和細(xì)節(jié)表現(xiàn)力,使得文生圖像類(lèi)人工智能在多個(gè)領(lǐng)域具有廣泛的應(yīng)用價(jià)值[16]。例如,在影視制作中,文生圖像類(lèi)人工智能可以生成高質(zhì)量的特效場(chǎng)景和角色模型。在游戲開(kāi)發(fā)中,可以創(chuàng)建出逼真的游戲場(chǎng)景和角色形象。在建筑設(shè)計(jì)領(lǐng)域,可以生成詳細(xì)的建筑設(shè)計(jì)圖紙和效果圖??偠灾纳鷪D像類(lèi)人工智能在生成圖像的高精度與細(xì)節(jié)表現(xiàn)力方面展現(xiàn)出了非凡的實(shí)力和潛力。
三、文生圖像類(lèi)人工智能對(duì)知識(shí)產(chǎn)權(quán)的侵犯風(fēng)險(xiǎn)
知識(shí)產(chǎn)權(quán)制度的核心在于通過(guò)賦予創(chuàng)新者對(duì)其創(chuàng)造成果的專(zhuān)有權(quán)激勵(lì)社會(huì)的創(chuàng)新活動(dòng)。如若知識(shí)產(chǎn)權(quán)受到侵害,創(chuàng)新者的勞動(dòng)成果可能輕易被他人無(wú)償使用或竊取,這將嚴(yán)重挫傷創(chuàng)新的積極性,阻礙社會(huì)整體的技術(shù)進(jìn)步和經(jīng)濟(jì)發(fā)展。在推動(dòng)高質(zhì)量發(fā)展的背景下,知識(shí)產(chǎn)權(quán)作為國(guó)家發(fā)展戰(zhàn)略性資源與國(guó)際競(jìng)爭(zhēng)核心要素的作用日益凸顯。隨著文生圖像類(lèi)人工智能服務(wù)的廣泛普及與應(yīng)用,文生圖像類(lèi)人工智能的訓(xùn)練數(shù)據(jù)是否構(gòu)成潛在侵權(quán),生成內(nèi)容的知識(shí)產(chǎn)權(quán)是否存在定位問(wèn)題以及相關(guān)權(quán)屬爭(zhēng)議,正成為社會(huì)各界普遍關(guān)注的焦點(diǎn)問(wèn)題。這一系列挑戰(zhàn),不僅考驗(yàn)著技術(shù)發(fā)展的倫理邊界,也促使人們重新審視并構(gòu)建適應(yīng)新時(shí)代需求的知識(shí)產(chǎn)權(quán)保護(hù)體系。
(一)訓(xùn)練數(shù)據(jù)構(gòu)成潛在侵權(quán)
雖從表面上看,文生圖像類(lèi)人工智能展現(xiàn)出了一定的創(chuàng)造性,然究其本質(zhì),仍是基于對(duì)既有學(xué)習(xí)資源的深度重組與再現(xiàn)。由此,著名語(yǔ)言學(xué)家諾姆·喬姆斯基(Noam Chomsky)更是直接將人工智能對(duì)既有知識(shí)資產(chǎn)的非授權(quán)使用比喻為高科技領(lǐng)域的剽竊行為[17]。于此背景下,若研發(fā)機(jī)構(gòu)在利用訓(xùn)練數(shù)據(jù)進(jìn)行人工智能訓(xùn)練時(shí),未能確保從訓(xùn)練材料提供者那里獲得充分的法律授權(quán),那么便極易觸發(fā)知識(shí)產(chǎn)權(quán)的爭(zhēng)議與糾紛。實(shí)際上,此類(lèi)問(wèn)題已在現(xiàn)實(shí)中出現(xiàn)。例如,Getty Images作為全球知名的圖片提供商,擁有大量圖片版權(quán),其圖片通常用于創(chuàng)意、企業(yè)、媒體等多個(gè)領(lǐng)域。Stability AI則是一家人工智能公司,開(kāi)發(fā)了名為Stable Diffusion的人工智能繪畫(huà)工具,此工具能夠根據(jù)文本提示生成圖像。Getty Images指控Stability AI未經(jīng)許可,非法使用其網(wǎng)站上的數(shù)百萬(wàn)張圖片作為訓(xùn)練數(shù)據(jù),這些圖片包括了Getty Images擁有或代表的版權(quán)作品,因此原告認(rèn)為被告在英國(guó)的服務(wù)器上下載并使用了其圖片,構(gòu)成侵權(quán)。
具體而言,訓(xùn)練數(shù)據(jù)的潛在侵權(quán)問(wèn)題主要體現(xiàn)在對(duì)原始數(shù)據(jù)知識(shí)產(chǎn)權(quán)的侵犯上。在人工智能模型的訓(xùn)練過(guò)程中,往往需要海量的數(shù)據(jù)作為支撐,這些數(shù)據(jù)可能來(lái)源于網(wǎng)絡(luò)公開(kāi)資源、商業(yè)數(shù)據(jù)庫(kù),甚至是個(gè)人上傳的照片、視頻等。然而,并非所有數(shù)據(jù)都可無(wú)限制地用于訓(xùn)練目的。許多數(shù)據(jù)背后隱藏著復(fù)雜的版權(quán)關(guān)系,如攝影作品的著作權(quán)、設(shè)計(jì)作品的版權(quán),甚至是受保護(hù)的商標(biāo)和專(zhuān)利信息。當(dāng)人工智能開(kāi)發(fā)者未經(jīng)授權(quán)便將這些數(shù)據(jù)納入訓(xùn)練集時(shí),便可能侵犯原作者的知識(shí)產(chǎn)權(quán),從而引發(fā)法律糾紛。這種侵權(quán)行為的隱蔽性在于,人工智能模型訓(xùn)練過(guò)程往往是一個(gè)“黑箱”操作,普通用戶(hù)難以直接觀察到數(shù)據(jù)的使用情況。因此,即使數(shù)據(jù)提供者明確標(biāo)注了版權(quán)信息或禁止商業(yè)使用的條款,亦可能因?yàn)榧夹g(shù)屏障或法律意識(shí)淡薄而被忽視。此外,由于人工智能技術(shù)的快速發(fā)展,相關(guān)法律法規(guī)的滯后性也加劇了這一問(wèn)題?,F(xiàn)有的版權(quán)法體系主要基于傳統(tǒng)創(chuàng)作模式構(gòu)建,對(duì)于人工智能訓(xùn)練數(shù)據(jù)的版權(quán)歸屬、使用權(quán)限等問(wèn)題尚未形成明確的規(guī)定,導(dǎo)致在實(shí)踐中難以有效界定侵權(quán)行為的邊界。
未經(jīng)授權(quán)使用受版權(quán)保護(hù)的作品作為訓(xùn)練數(shù)據(jù),還可能導(dǎo)致一系列連鎖反應(yīng)。首先,這種行為將削弱原作者的創(chuàng)作動(dòng)力與市場(chǎng)競(jìng)爭(zhēng)力。當(dāng)創(chuàng)作者發(fā)現(xiàn)其作品無(wú)法在市場(chǎng)上獲得應(yīng)有回報(bào)時(shí),可能會(huì)減少創(chuàng)作投入或轉(zhuǎn)向其他領(lǐng)域,從而導(dǎo)致優(yōu)秀作品的減少以及整個(gè)文化創(chuàng)意產(chǎn)業(yè)的萎縮。其次,這種行為會(huì)擾亂市場(chǎng)秩序和公平競(jìng)爭(zhēng)原則。那些遵守法律、尊重版權(quán)的企業(yè)和個(gè)人在競(jìng)爭(zhēng)中會(huì)處于不利地位,而侵權(quán)者則可借助他人成果快速獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。這不僅會(huì)損害合法經(jīng)營(yíng)者的利益,還會(huì)破壞整個(gè)行業(yè)的健康發(fā)展。再次,這種侵權(quán)行為可能對(duì)文生圖像類(lèi)人工智能的長(zhǎng)遠(yuǎn)發(fā)展產(chǎn)生負(fù)面影響。由于訓(xùn)練數(shù)據(jù)的質(zhì)量直接影響人工智能模型的性能和表現(xiàn),若訓(xùn)練數(shù)據(jù)中充斥大量的侵權(quán)內(nèi)容,那么由此訓(xùn)練出的模型也會(huì)存在潛在的法律風(fēng)險(xiǎn)。存在潛在法律風(fēng)險(xiǎn)的模型若被廣泛應(yīng)用于實(shí)際場(chǎng)景中并產(chǎn)生侵權(quán)行為,將會(huì)損害原創(chuàng)作者的權(quán)益,并對(duì)人工智能技術(shù)的聲譽(yù)和可信度產(chǎn)生負(fù)面影響。由此將導(dǎo)致公眾對(duì)人工智能技術(shù)的質(zhì)疑和擔(dān)憂加劇,進(jìn)而阻礙人工智能技術(shù)的未來(lái)發(fā)展與應(yīng)用。
(二)知識(shí)產(chǎn)權(quán)歸屬尚未明晰
傳統(tǒng)上,知識(shí)產(chǎn)權(quán)體系主要是圍繞人類(lèi)創(chuàng)作活動(dòng)而構(gòu)建的,其核心在于保護(hù)創(chuàng)作者的獨(dú)創(chuàng)性表達(dá)和智力勞動(dòng)成果。然而,文生圖像類(lèi)人工智能的創(chuàng)作過(guò)程并非完全由人類(lèi)主導(dǎo),而是由人類(lèi)與人工智能共同協(xié)作完成。文生圖像類(lèi)人工智能生成的作品是否能受到知識(shí)產(chǎn)權(quán)保護(hù)?其又能否被視為法律意義上的“作者”?目前,已有一些機(jī)構(gòu)對(duì)此問(wèn)題明確表達(dá)立場(chǎng)。例如,《科學(xué)》雜志公開(kāi)聲明,堅(jiān)決不接受ChatGPT等人工智能工具作為學(xué)術(shù)論文的合著者或作者[18]。
《中華人民共和國(guó)著作權(quán)法》第3條規(guī)定,作品是指文學(xué)、藝術(shù)和科學(xué)領(lǐng)域內(nèi)具有獨(dú)創(chuàng)性并能以一定形式表現(xiàn)的智力成果。然而,在文生圖像類(lèi)人工智能中,圖像的生成高度依賴(lài)于人工智能模型,而模型的訓(xùn)練又依賴(lài)于大量已有版權(quán)作品的數(shù)據(jù)。這導(dǎo)致生成的圖像在獨(dú)創(chuàng)性界定上存在模糊性[19]。一方面,用戶(hù)通過(guò)輸入獨(dú)特的文本描述和設(shè)置參數(shù),對(duì)圖像生成過(guò)程進(jìn)行了智力投入;另一方面,圖像的具體表現(xiàn)形式又是由人工智能模型基于已有數(shù)據(jù)自動(dòng)生成的。這就導(dǎo)致文生圖像類(lèi)人工智能生成的作品在知識(shí)產(chǎn)權(quán)歸屬問(wèn)題上,既不能完全歸屬于人類(lèi)創(chuàng)作者,也不能簡(jiǎn)單地視為人工智能的“作品”。因此,如何界定這種混合了人類(lèi)智力和機(jī)器智能的生成物的獨(dú)創(chuàng)性,成為確定知識(shí)產(chǎn)權(quán)歸屬的首要問(wèn)題。
文生圖像類(lèi)人工智能的知識(shí)產(chǎn)權(quán)歸屬問(wèn)題,還涉及復(fù)雜的權(quán)利主體和利益分配爭(zhēng)議。首先,從權(quán)利主體的角度來(lái)看,文生圖像類(lèi)人工智能的知識(shí)產(chǎn)權(quán)歸屬涉及多個(gè)主體。包括輸入文本描述的用戶(hù)、設(shè)計(jì)并優(yōu)化人工智能模型的開(kāi)發(fā)者以及可能涉及的第三方版權(quán)持有人,如訓(xùn)練數(shù)據(jù)中包含的已有作品版權(quán)人。這些主體之間在權(quán)利歸屬問(wèn)題上往往存在分歧和爭(zhēng)議。用戶(hù)可能認(rèn)為自己通過(guò)輸入文本描述對(duì)生成圖像產(chǎn)生了重要影響,因此應(yīng)享有相應(yīng)的知識(shí)產(chǎn)權(quán)。而開(kāi)發(fā)者則認(rèn)為他們通過(guò)投入大量資源和精力進(jìn)行算法開(kāi)發(fā)和模型訓(xùn)練,同樣對(duì)生成圖像作出了重要貢獻(xiàn)。第三方版權(quán)持有人則可能主張生成圖像中包含了其享有版權(quán)的元素,應(yīng)享有相應(yīng)的權(quán)利[20]。其次,從利益分配的角度來(lái)看,文生圖像類(lèi)人工智能的知識(shí)產(chǎn)權(quán)歸屬問(wèn)題涉及經(jīng)濟(jì)利益的分配。在商業(yè)化應(yīng)用中,生成圖像可能被用于各種商業(yè)活動(dòng),從而產(chǎn)生巨大的經(jīng)濟(jì)收益。然而,由于知識(shí)產(chǎn)權(quán)歸屬問(wèn)題尚未明晰,這些經(jīng)濟(jì)收益的分配也變得異常困難。一方面,不同主體之間可能因權(quán)利歸屬問(wèn)題而產(chǎn)生糾紛和訴訟;另一方面,即使權(quán)利歸屬問(wèn)題得到解決,如何合理、公正地分配經(jīng)濟(jì)收益亦是一個(gè)亟待解決的問(wèn)題。
(三)商業(yè)應(yīng)用擴(kuò)大侵權(quán)規(guī)模
在商業(yè)語(yǔ)境下,文生圖像類(lèi)人工智能的廣泛應(yīng)用為創(chuàng)意產(chǎn)業(yè)注入了新的活力,但也悄然地?cái)U(kuò)大了對(duì)知識(shí)產(chǎn)權(quán)的侵犯規(guī)模。從市場(chǎng)需求角度來(lái)看,文生圖像類(lèi)人工智能的快速發(fā)展?jié)M足了商業(yè)領(lǐng)域?qū)Ω哔|(zhì)量、個(gè)性化視覺(jué)內(nèi)容的迫切需求。廣告商、設(shè)計(jì)師、媒體機(jī)構(gòu)等采用此技術(shù),用以快速生成符合品牌調(diào)性和市場(chǎng)趨勢(shì)的圖像產(chǎn)品,從而吸引消費(fèi)者的眼球。然而,這種高效的生產(chǎn)方式亦催生創(chuàng)意行業(yè)中“快餐文化”的顯現(xiàn),即追求速度而忽視版權(quán)保護(hù)。在商業(yè)競(jìng)爭(zhēng)的壓力下,部分企業(yè)或個(gè)人為節(jié)省成本,選擇直接復(fù)制、改編或未經(jīng)授權(quán)使用他人的文生圖像作品[21]。這種行為不僅侵犯了原作者的創(chuàng)作權(quán)益,亦擾亂了市場(chǎng)的公平競(jìng)爭(zhēng)秩序。隨著商業(yè)需求的不斷增長(zhǎng),這種侵權(quán)行為逐漸呈現(xiàn)出規(guī)?;?、常態(tài)化的趨勢(shì),給知識(shí)產(chǎn)權(quán)保護(hù)帶來(lái)前所未有的挑戰(zhàn)。
互聯(lián)網(wǎng)平臺(tái)在文生圖像作品的商業(yè)應(yīng)用中扮演著重要角色,但由于在內(nèi)容審核和版權(quán)保護(hù)方面存在不足,平臺(tái)為侵權(quán)作品提供了傳播渠道。例如,一位名為Chiara Biancheri的建筑師和圖形藝術(shù)家,在意大利熱那亞法院起訴意大利廣播電視公司(RAI)侵犯自己數(shù)字藝術(shù)作品The scent of the night的版權(quán)。案件中,RAI使用Midjourney對(duì)Chiara Biancheri的數(shù)字藝術(shù)作品進(jìn)行二次創(chuàng)作,生成的侵權(quán)圖片作品不僅在線下布展時(shí)使用,還發(fā)布在RAI社交平臺(tái)上進(jìn)行商業(yè)宣傳,吸引了大量點(diǎn)贊和轉(zhuǎn)發(fā)。由于社交媒體用戶(hù)眾多、傳播速度快,侵權(quán)圖片的擴(kuò)散速度遠(yuǎn)超傳統(tǒng)媒介,這無(wú)疑使得知識(shí)產(chǎn)權(quán)遭受侵犯的規(guī)模迅速擴(kuò)大。初審法院認(rèn)為RAI的行為具有商業(yè)屬性,裁定RAI侵犯了Chiara Biancheri的知識(shí)產(chǎn)權(quán),判決賠償4萬(wàn)歐元,同時(shí)要求刪除網(wǎng)站上的侵權(quán)內(nèi)容。
更為復(fù)雜的是,文生圖像類(lèi)人工智能的商業(yè)應(yīng)用還涉及跨地域、跨文化的知識(shí)產(chǎn)權(quán)問(wèn)題。隨著互聯(lián)網(wǎng)的普及和全球化進(jìn)程的加速,人工智能生成的圖像可輕松跨越國(guó)界傳播。然而,不同國(guó)家和地區(qū)之間的知識(shí)產(chǎn)權(quán)法律存在差異甚至沖突,這使得跨國(guó)糾紛變得更加復(fù)雜和難以解決[22]。例如,美國(guó)版權(quán)局拒絕登記僅由純粹的機(jī)械過(guò)程而沒(méi)有人類(lèi)作者“創(chuàng)造性”投入的情況下生成的圖像作品。而英國(guó)《版權(quán)、設(shè)計(jì)和專(zhuān)利法》規(guī)定,如果人工智能生成的圖像作品涉及復(fù)雜的指令過(guò)程,那么生成的圖像作品可以被認(rèn)定由指令者創(chuàng)作。英國(guó)版權(quán)法對(duì)人工智能生成的圖像作品的“原創(chuàng)性”解釋相對(duì)靈活,允許在人工智能創(chuàng)作過(guò)程中存在一定程度的算法自主性和人類(lèi)指令的結(jié)合,而美國(guó)版權(quán)法對(duì)人工智能生成圖像作品的“人類(lèi)作者”要求更為嚴(yán)格。知識(shí)產(chǎn)權(quán)法律規(guī)定的差異給文生圖像類(lèi)人工智能的商業(yè)應(yīng)用帶來(lái)了極大的不確定性和風(fēng)險(xiǎn)。侵權(quán)者可以利用這些差異逃避法律制裁,從而進(jìn)一步加劇了知識(shí)產(chǎn)權(quán)侵犯的規(guī)模性和影響范圍。
四、文生圖像類(lèi)人工智能知識(shí)產(chǎn)權(quán)侵犯風(fēng)險(xiǎn)的治理路徑
文生圖像類(lèi)人工智能具有十分廣闊的應(yīng)用前景,亦可能帶來(lái)諸多現(xiàn)實(shí)侵權(quán)風(fēng)險(xiǎn)與法律挑戰(zhàn)。故此,在思考文生圖像類(lèi)人工智能知識(shí)產(chǎn)權(quán)侵權(quán)風(fēng)險(xiǎn)的相關(guān)治理路徑時(shí),應(yīng)努力做到揚(yáng)長(zhǎng)避短、趨利避害,實(shí)現(xiàn)發(fā)展與規(guī)范并用。
(一)技術(shù)層面:強(qiáng)化圖像的獨(dú)特性與可溯源性
首先,圖像的獨(dú)特性是使其在眾多作品中脫穎而出的關(guān)鍵。在文生圖像類(lèi)人工智能領(lǐng)域,獨(dú)特性往往依賴(lài)于先進(jìn)的生成算法與豐富的數(shù)據(jù)集,而算法創(chuàng)新是推動(dòng)圖像獨(dú)特性不斷提升的核心動(dòng)力。傳統(tǒng)的生成對(duì)抗網(wǎng)絡(luò)通過(guò)讓“生成器”和“判別器”這兩個(gè)網(wǎng)絡(luò)相互競(jìng)爭(zhēng)不斷優(yōu)化圖像質(zhì)量,但這種方法生成的圖像在細(xì)節(jié)上仍可能顯得單調(diào)或重復(fù)。因此,研究者們正致力于開(kāi)發(fā)更加復(fù)雜和多樣化的生成模型,如StyleGAN、BigGAN等,這些模型能夠在保持圖像整體風(fēng)格一致性的同時(shí),通過(guò)調(diào)整內(nèi)部參數(shù)實(shí)現(xiàn)更加細(xì)微和獨(dú)有的特征變化。同時(shí),數(shù)據(jù)集的多樣性和質(zhì)量也是影響圖像獨(dú)特性的重要因素。為了生成具有鮮明個(gè)性和風(fēng)格的圖像,需要收集并整理來(lái)自不同領(lǐng)域、不同文化背景的豐富數(shù)據(jù)集。這些數(shù)據(jù)集應(yīng)包含多樣化的圖像樣本,涵蓋不同光照條件、拍攝角度、情感表達(dá)等多種因素,以確保生成模型能夠?qū)W習(xí)到更加全面和豐富的圖像特征。在算法與數(shù)據(jù)的雙重驅(qū)動(dòng)下,文生圖像作品的獨(dú)特性得到顯著提升。但是,獨(dú)特性并不等同于隨機(jī)性。一個(gè)優(yōu)秀的圖像生成系統(tǒng)應(yīng)在能夠保持圖像獨(dú)特性的同時(shí),確保其在美學(xué)上的一致性和連貫性,從而滿(mǎn)足用戶(hù)對(duì)高質(zhì)量圖像的需求。
其次,構(gòu)建有效的可溯源性機(jī)制對(duì)于保護(hù)創(chuàng)作者權(quán)益、打擊知識(shí)產(chǎn)權(quán)侵犯行為具有重要意義。水印技術(shù)是一種傳統(tǒng)的可溯源性手段,其通過(guò)在圖像中嵌入不易察覺(jué)的標(biāo)識(shí)信息,如數(shù)字簽名、時(shí)間戳等,可以在圖像被傳播和使用時(shí)追蹤來(lái)源和流轉(zhuǎn)路徑。然而,傳統(tǒng)的水印技術(shù)往往面臨易被破壞或篡改的風(fēng)險(xiǎn)。因此,研究者們正在探索更加隱蔽和不易更改的水印技術(shù),如基于深度學(xué)習(xí)的隱寫(xiě)術(shù)、基于圖像特征的加密技術(shù)等,以提高水印的安全性和可靠性。
除了水印技術(shù)外,區(qū)塊鏈技術(shù)也為文生圖像作品的可溯源性提供了新的解決方案。區(qū)塊鏈的分布式賬本特性使得每筆交易和數(shù)據(jù)變更都能被永久記錄并公開(kāi)驗(yàn)證。通過(guò)將圖像的生成信息、版權(quán)歸屬、流轉(zhuǎn)記錄等關(guān)鍵數(shù)據(jù)上鏈存儲(chǔ),可以構(gòu)建一個(gè)透明、可信、不可篡改的可溯源性系統(tǒng)[23]。當(dāng)發(fā)生侵權(quán)行為時(shí),權(quán)利人可以通過(guò)區(qū)塊鏈上的證據(jù)鏈快速證明自己的權(quán)益并追究侵權(quán)者的法律責(zé)任。值得注意的是,構(gòu)建可溯源性機(jī)制不僅需要技術(shù)的支持,還需要法律的保障。政府和相關(guān)機(jī)構(gòu)應(yīng)制定和完善相關(guān)法律法規(guī),以明確圖像生成、傳播、使用等各個(gè)環(huán)節(jié)的法律責(zé)任和義務(wù),從而確??伤菰葱詸C(jī)制的有效實(shí)施。
最后,在追求圖像獨(dú)特性和可溯源性的過(guò)程中,技術(shù)融合與倫理考量同樣重要。技術(shù)融合意味著將不同領(lǐng)域的技術(shù)成果相互融合、相互借鑒以形成更加完善的技術(shù)體系。然而,在追求技術(shù)融合的同時(shí)也不能忽視倫理考量。具體而言,在強(qiáng)化圖像獨(dú)特性和可溯源性的過(guò)程中應(yīng)遵循以下倫理原則:一是維護(hù)用戶(hù)隱私和數(shù)據(jù)安全,不得非法收集、使用或侵犯用戶(hù)知識(shí)產(chǎn)權(quán);二是保護(hù)創(chuàng)作者權(quán)益,明確版權(quán)歸屬和授權(quán)范圍,打擊侵權(quán)行為;三是促進(jìn)文化多樣性,鼓勵(lì)不同文化背景下的創(chuàng)意交流和融合,避免技術(shù)壟斷和文化同質(zhì)化。
(二)法律層面:完善侵權(quán)責(zé)任認(rèn)定與承擔(dān)規(guī)制
首先,明確法律框架下的責(zé)任主體與行為界定。在責(zé)任主體界定方面,國(guó)家互聯(lián)網(wǎng)信息辦公室等七部門(mén)聯(lián)合公布的《生成式人工智能服務(wù)管理暫行辦法》規(guī)定,提供者應(yīng)當(dāng)依法承擔(dān)網(wǎng)絡(luò)信息內(nèi)容生產(chǎn)者責(zé)任,履行網(wǎng)絡(luò)信息安全義務(wù)。此規(guī)定明確了責(zé)任主體為生成式人工智能服務(wù)提供者,包括技術(shù)開(kāi)發(fā)者、內(nèi)容使用者與平臺(tái)運(yùn)營(yíng)商。具體而言,技術(shù)開(kāi)發(fā)者作為人工智能系統(tǒng)的提供者,應(yīng)對(duì)其設(shè)計(jì)、開(kāi)發(fā)過(guò)程中可能存在的侵權(quán)風(fēng)險(xiǎn)進(jìn)行合理預(yù)見(jiàn)并采取必要措施加以防范,若因技術(shù)缺陷導(dǎo)致生成內(nèi)容侵犯他人知識(shí)產(chǎn)權(quán),開(kāi)發(fā)者應(yīng)承擔(dān)相應(yīng)的侵權(quán)責(zé)任;內(nèi)容使用者在使用人工智能生成內(nèi)容時(shí),也應(yīng)盡到合理的注意義務(wù),避免未經(jīng)授權(quán)使用他人作品或進(jìn)行不當(dāng)?shù)亩蝿?chuàng)作;平臺(tái)運(yùn)營(yíng)商則應(yīng)承擔(dān)內(nèi)容審核與監(jiān)管的責(zé)任,確保平臺(tái)上傳播的內(nèi)容不侵犯他人知識(shí)產(chǎn)權(quán)[24]。在行為界定方面,應(yīng)明確何種行為構(gòu)成對(duì)知識(shí)產(chǎn)權(quán)的侵犯。對(duì)于文生圖像類(lèi)人工智能生成的內(nèi)容,若其高度相似于已有作品且未經(jīng)原作者許可,則可能構(gòu)成著作權(quán)侵權(quán)。此外,應(yīng)關(guān)注技術(shù)使用過(guò)程中可能涉及的不正當(dāng)競(jìng)爭(zhēng)、商業(yè)秘密泄露等侵權(quán)行為,確保法律規(guī)制的全面性和有效性。
其次,構(gòu)建科學(xué)合理的責(zé)任判定標(biāo)準(zhǔn)與程序。在責(zé)任判定標(biāo)準(zhǔn)上,充分考慮文生圖像類(lèi)人工智能的特殊性。由于人工智能生成內(nèi)容的過(guò)程涉及復(fù)雜的算法與數(shù)據(jù)處理,其獨(dú)創(chuàng)性、相似性等問(wèn)題的判定往往比傳統(tǒng)作品更為復(fù)雜。因此,在構(gòu)建責(zé)任判定標(biāo)準(zhǔn)時(shí),應(yīng)引入專(zhuān)業(yè)鑒定機(jī)構(gòu)或?qū)<乙庖?jiàn),結(jié)合技術(shù)原理與法律規(guī)定進(jìn)行綜合評(píng)判[25]。一方面,明確責(zé)任判定的程序性要求。在侵權(quán)糾紛發(fā)生時(shí),確保當(dāng)事人能夠便捷地提起訴訟或仲裁請(qǐng)求,并享有充分的舉證權(quán)利。法院或仲裁機(jī)構(gòu)在審理過(guò)程中,秉持公正、公平的原則,充分聽(tīng)取各方意見(jiàn),確保裁判結(jié)果的合法性與合理性。另一方面,關(guān)注責(zé)任判定的時(shí)效性問(wèn)題。由于技術(shù)發(fā)展迅速、侵權(quán)手段多樣,應(yīng)適當(dāng)縮短侵權(quán)訴訟的時(shí)效期間,以便權(quán)利人能夠及時(shí)維護(hù)自身權(quán)益。對(duì)于惡意侵權(quán)、重復(fù)侵權(quán)等行為,應(yīng)加大懲罰力度,提高違法成本,形成有效的震懾作用。
最后,加強(qiáng)法律適用與執(zhí)行協(xié)同性。在法律適用層面,確?,F(xiàn)有法律體系能夠有效應(yīng)對(duì)文生圖像類(lèi)人工智能生成內(nèi)容帶來(lái)的挑戰(zhàn)。對(duì)于現(xiàn)行法律中未明確規(guī)定的問(wèn)題,需要通過(guò)立法解釋、司法解釋等方式予以明確。同時(shí)關(guān)注國(guó)際法律動(dòng)態(tài),借鑒國(guó)外先進(jìn)經(jīng)驗(yàn),不斷完善我國(guó)的知識(shí)產(chǎn)權(quán)保護(hù)法律體系。在執(zhí)行層面,強(qiáng)化執(zhí)法力度與效率,加強(qiáng)與司法機(jī)關(guān)的溝通協(xié)調(diào)機(jī)制建設(shè),確保行政執(zhí)法與司法裁判的有效銜接與協(xié)同。
(三)社會(huì)層面:增進(jìn)行業(yè)自律與版權(quán)知識(shí)普及
首先,行業(yè)自律要求技術(shù)開(kāi)發(fā)者樹(shù)立正確的行業(yè)規(guī)范。在文生圖像類(lèi)人工智能日新月異的今天,行業(yè)自律不僅是對(duì)外在規(guī)范的遵守,更是在內(nèi)心深處對(duì)知識(shí)產(chǎn)權(quán)的尊重與維護(hù)。技術(shù)開(kāi)發(fā)者應(yīng)當(dāng)主動(dòng)承擔(dān)保護(hù)知識(shí)產(chǎn)權(quán)的責(zé)任,通過(guò)技術(shù)手段防范侵權(quán)風(fēng)險(xiǎn),確保技術(shù)的每一次進(jìn)步都能為社會(huì)帶來(lái)正面價(jià)值。例如,可以借鑒歐盟《人工智能生成材料版權(quán)登記指南》的經(jīng)驗(yàn),明確人工智能生成內(nèi)容在何種條件下可以獲得版權(quán)保護(hù),以及用戶(hù)、開(kāi)發(fā)者與平臺(tái)之間的責(zé)任劃分。行業(yè)自律還體現(xiàn)在行業(yè)標(biāo)準(zhǔn)的制定與執(zhí)行上。隨著文生圖像類(lèi)人工智能的廣泛應(yīng)用,制定一套科學(xué)、合理、可操作的行業(yè)標(biāo)準(zhǔn)顯得尤為重要。這些標(biāo)準(zhǔn)應(yīng)當(dāng)明確界定技術(shù)的使用范圍、創(chuàng)作成果的歸屬權(quán)、侵權(quán)行為的認(rèn)定標(biāo)準(zhǔn)等關(guān)鍵問(wèn)題。技術(shù)開(kāi)發(fā)者應(yīng)加強(qiáng)交流與合作,共同探索更加安全、高效的技術(shù)解決方案,通過(guò)共享技術(shù)成果、交流治理經(jīng)驗(yàn),可以形成合力,共同應(yīng)對(duì)知識(shí)產(chǎn)權(quán)侵犯風(fēng)險(xiǎn)。
其次,版權(quán)知識(shí)普及應(yīng)引導(dǎo)公眾建立對(duì)人工智能時(shí)代版權(quán)的全新認(rèn)知。在人工智能繪畫(huà)、圖像生成等場(chǎng)景中,諸多作品看似由機(jī)器獨(dú)立完成,然其背后往往蘊(yùn)含著人類(lèi)創(chuàng)作者的靈感與努力。因此,即使是人工智能生成的圖像,其版權(quán)歸屬、使用權(quán)限等也需遵循相應(yīng)的法律法規(guī)。無(wú)論是人類(lèi)創(chuàng)作還是人工智能輔助創(chuàng)作,原創(chuàng)作品都應(yīng)受到同等的版權(quán)保護(hù)。版權(quán)知識(shí)普及注重人工智能技術(shù)與版權(quán)知識(shí)的融合教育。通過(guò)舉辦專(zhuān)題講座、在線課程、工作坊等形式,向公眾普及人工智能技術(shù)在藝術(shù)創(chuàng)作中的應(yīng)用原理、版權(quán)保護(hù)的基本原則、人工智能作品版權(quán)歸屬的判定標(biāo)準(zhǔn)等。著重提升公眾對(duì)人工智能作品版權(quán)的識(shí)別能力。在人工智能技術(shù)日益普及的今天,公眾在瀏覽、分享、使用人工智能生成的作品時(shí),應(yīng)具備基本的版權(quán)意識(shí),能夠區(qū)分哪些作品是原創(chuàng)的,哪些可能是人工智能生成的,并了解相應(yīng)的使用限制與授權(quán)要求[26]。積極探索利用人工智能技術(shù)輔助版權(quán)知識(shí)普及的新途徑。例如,開(kāi)發(fā)基于人工智能的版權(quán)知識(shí)問(wèn)答系統(tǒng)、版權(quán)侵權(quán)檢測(cè)工具等,為公眾提供更加便捷、高效的版權(quán)知識(shí)獲取與侵權(quán)防范服務(wù)。
最后,鼓勵(lì)社會(huì)公眾積極參與知識(shí)產(chǎn)權(quán)監(jiān)督工作。公眾是知識(shí)產(chǎn)權(quán)的最終受益者,亦是監(jiān)督體系的重要力量。通過(guò)加強(qiáng)宣傳教育,增強(qiáng)公眾的版權(quán)意識(shí)和維權(quán)能力,可以激發(fā)他們參與監(jiān)督的積極性。同時(shí),建立便捷的舉報(bào)渠道和獎(jiǎng)勵(lì)機(jī)制,鼓勵(lì)公眾積極舉報(bào)侵權(quán)行為,形成全社會(huì)共同抵制侵權(quán)的良好氛圍。例如,對(duì)于積極維護(hù)人工智能生成圖像知識(shí)產(chǎn)權(quán)、表現(xiàn)良好的企業(yè)給予政策扶持、稅收優(yōu)惠等激勵(lì)措施;而對(duì)于侵權(quán)企業(yè)則進(jìn)行嚴(yán)厲的經(jīng)濟(jì)處罰,提高其違法成本。這種激勵(lì)機(jī)制的引入,有助于形成良好的市場(chǎng)秩序和競(jìng)爭(zhēng)環(huán)境。
五、余論
以Sora、Midjourney、Stable Diffusion為代表的文生圖像類(lèi)人工智能不僅為圖像生成行業(yè)帶來(lái)了新質(zhì)生產(chǎn)力,更構(gòu)建了跨越時(shí)空界限的全球模擬器。可以預(yù)見(jiàn),未來(lái)文生圖像類(lèi)人工智能或?qū)⒀苌佣鄻拥膽?yīng)用場(chǎng)景與業(yè)態(tài),進(jìn)而引發(fā)全球價(jià)值鏈重構(gòu)。誠(chéng)然,文生圖像類(lèi)人工智能的迅猛崛起為知識(shí)產(chǎn)權(quán)保護(hù)帶來(lái)了新問(wèn)題與新挑戰(zhàn)。但這并非意味著傳統(tǒng)的知識(shí)產(chǎn)權(quán)保護(hù)理論與當(dāng)前的技術(shù)發(fā)展現(xiàn)實(shí)已全然脫節(jié)。相反,這恰是一個(gè)契機(jī),促使人們重新審視并調(diào)適現(xiàn)有的理論體系,推動(dòng)其與時(shí)俱進(jìn),以適應(yīng)新技術(shù)環(huán)境下的權(quán)益保護(hù)與產(chǎn)業(yè)發(fā)展需求。隨著社會(huì)知識(shí)產(chǎn)權(quán)尊重意識(shí)的普遍提升,以及法律對(duì)知識(shí)產(chǎn)權(quán)侵犯行為的嚴(yán)厲打擊,文生圖像類(lèi)人工智能的創(chuàng)作者和使用者將更加自覺(jué)地遵守相關(guān)法律法規(guī),共同維護(hù)一個(gè)健康、有序的市場(chǎng)環(huán)境。由此,文生圖像類(lèi)人工智能與知識(shí)產(chǎn)權(quán)保護(hù)的深度融合,不僅可以推動(dòng)藝術(shù)創(chuàng)作和設(shè)計(jì)的邊界不斷拓展,還將為整個(gè)社會(huì)的創(chuàng)新和發(fā)展注入新的活力與動(dòng)能。
[參考文獻(xiàn)]
畢文軒.生成式人工智能生成內(nèi)容的版權(quán)屬性與保護(hù)路徑[J].比較法研究,2024(3):55-71.
鄭海味,張偉君.人工智能生成圖片中用戶(hù)的獨(dú)創(chuàng)性貢獻(xiàn):以“AI文生圖”著作權(quán)案判決為例[J].中國(guó)出版,2024(12):52-57.
楊奇光,張宇. Sora與多模態(tài)內(nèi)容生產(chǎn):文生世界、計(jì)算游戲與編輯治理[J].中國(guó)編輯,2024(6):64-70.
蔡琳,楊廣軍.人工智能生成內(nèi)容(AIGC)的作品認(rèn)定困境與可版權(quán)性標(biāo)準(zhǔn)構(gòu)建[J].出版發(fā)行研究,2024(1):67-74.
徐小奔,薛少雄.生成式人工智能服務(wù)提供者版權(quán)注意義務(wù)的法律構(gòu)造[J].科技與出版,2024(7):48-58.
張吉豫,汪賽飛.大模型數(shù)據(jù)訓(xùn)練中的著作權(quán)合理使用研究[J].華東政法大學(xué)學(xué)報(bào),2024(4):20-33.
MITCHELL W J T.Picture Theory:Essays on Verbal and Visual" Representation [M]. Chicago:University of Chicago Press,1994:36.
閆宏秀,宋勝男.雙重脆弱性與適度信任:從ChatGPT到Sora [J].新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2024(6):81-91.
季冬梅.從知識(shí)產(chǎn)權(quán)到數(shù)據(jù)要素:AIGC相關(guān)制度困境的化解[J/OL].科技進(jìn)步與對(duì)策:1-10 [2024-08-16]. http://kns.cnki.net/kcms/detail/42.1224.G3.20240425.1630.004.html.
金雪濤,周也馨.從ChatGPT火爆看智能生成內(nèi)容的風(fēng)險(xiǎn)及治理[J].編輯之友,2023(11):29-35.
劉智鋒,吳亞平,王繼民.人工智能生成內(nèi)容技術(shù)對(duì)知識(shí)生產(chǎn)與傳播的影響[J].情報(bào)雜志,2023(7):123-130.
叢立先,李泳霖.人工智能文生視頻大模型的作品風(fēng)險(xiǎn)、著作權(quán)歸屬及有效治理[J].新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2024(6):101-111.
劉金瑞.生成式人工智能大模型的新型風(fēng)險(xiǎn)與規(guī)制框架[J].行政法學(xué)研究,2024(2):17-32.
陳兵.通用人工智能創(chuàng)新發(fā)展帶來(lái)的風(fēng)險(xiǎn)挑戰(zhàn)及其法治應(yīng)對(duì)[J].知識(shí)產(chǎn)權(quán),2023(8):53-73.
朱閣.“AI文生圖”的法律屬性與權(quán)利歸屬研究[J].知識(shí)產(chǎn)權(quán),2024(1):24-35.
王志文. AIGC大模型數(shù)據(jù)訓(xùn)練版權(quán)規(guī)制的終端轉(zhuǎn)向[J].北京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2024(5):64-75.
申景梅,唐一力.人工智能生成作品的版權(quán)歸屬研究:在二元論的桎梏中展開(kāi)[J].出版發(fā)行研究,2024(5):70-77.
Thorp H. ChatGPT is fun,but not an author [J]. Science,2023,379(6630):313.
劉少軍,聶琳峰.人工智能生成內(nèi)容的著作權(quán)法之辯[J].南昌大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2024(1):107-118.
吳漢舟,張杰,李越,等.人工智能模型水印研究進(jìn)展[J].中國(guó)圖象圖形學(xué)報(bào),2023(6):1792-1810.
陳俊良. AI合成視頻版權(quán)治理的日本經(jīng)驗(yàn)[J].中國(guó)電視,2024(1):106-112.
刁佳星.生成式人工智能服務(wù)提供者版權(quán)侵權(quán)注意義務(wù)研究[J].中國(guó)出版,2024(1):25-30.
段永杰,李彤.數(shù)字出版中AIGC生成物的應(yīng)用場(chǎng)景及其倫理規(guī)制[J].出版科學(xué),2023(6):84-93.
張金平.論人工智能生成物可版權(quán)性及侵權(quán)責(zé)任承擔(dān)[J].南京社會(huì)科學(xué),2023(10):77-89.
陳晨.論人工智能生成內(nèi)容的可版權(quán)性問(wèn)題:以ChatGPT生成內(nèi)容為例[J].科技與出版,2023(6):98-106.
邵紅紅.生成式人工智能版權(quán)侵權(quán)治理研究[J].出版發(fā)行研究,2023(6):29-38.
[責(zé)任編輯 王艷芳]
[基金項(xiàng)目]中國(guó)高??萍计诳芯繒?huì)“善鋒軟件基金”項(xiàng)目(CUJS2023-SF036)
[收稿日期]2024-09-10
[作者簡(jiǎn)介]郭延龍(1991-),男,山東聊城人,新疆和田學(xué)院藝術(shù)學(xué)院副院長(zhǎng)(援疆),安徽大學(xué)藝術(shù)學(xué)院副教授,博士。
青島科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2024年4期