摘要:人工智能技術(shù)具有深刻變革內(nèi)容生產(chǎn)范式的能力,正成為內(nèi)容生產(chǎn)的重要驅(qū)動(dòng)力。深度語(yǔ)音合成作為人工智能應(yīng)用的重要領(lǐng)域,拓展了聲音的多樣性和制作模式,為用戶提供了豐富的聽覺體驗(yàn)。然而,這也帶來(lái)一系列潛在的侵權(quán)風(fēng)險(xiǎn)。為此,本文通過(guò)研究分析此類深度語(yǔ)音合成內(nèi)容的使用現(xiàn)狀、技術(shù)原理及應(yīng)用類型,就其生產(chǎn)傳播過(guò)程可能涉及的侵權(quán)主體與侵犯權(quán)利等法律問(wèn)題進(jìn)行闡述,并提出應(yīng)對(duì)治理策略,確保深度語(yǔ)音合成技術(shù)的健康發(fā)展,為未來(lái)內(nèi)容生產(chǎn)拓展更廣闊的空間。
關(guān)鍵詞:深度語(yǔ)音合成;版權(quán);AI 歌手;侵權(quán)治理
俗話說(shuō),眼見為實(shí),耳聽為虛。如今,在技術(shù)支持下“生產(chǎn)”的聲音更是難辨真假。2023 年4月,歌曲《Heart On My Sleeve》由聲音訓(xùn)練模型制成并在Tiktok上迅速躥紅。2023 年4 月12 日,UP 主“陳墨瞳1995”在Bilibili 平臺(tái)發(fā)布了第一則AI 孫燕姿翻唱作品,4 月14 日發(fā)布的AI 孫燕姿翻唱周杰倫《發(fā)如雪》視頻播放量已超過(guò)300 萬(wàn),點(diǎn)贊、投幣、收藏、轉(zhuǎn)發(fā)量均達(dá)數(shù)萬(wàn)。它們的相似之處在于均擁有與原歌手極其相似的聲音特征。據(jù)不完全統(tǒng)計(jì),各大社交平臺(tái)中此類模仿真人的“AI 歌手”數(shù)量已達(dá)近百個(gè),“AI 那英”“AI 蔡依林”“AI TaylorSwift”等先后問(wèn)世,國(guó)內(nèi)外流行音樂(lè)領(lǐng)域的知名歌手基本都擁有了“AI 版本”。
由人工智能技術(shù)合成的音樂(lè)內(nèi)容由此進(jìn)入了更廣范圍的公眾視野,可見技術(shù)創(chuàng)新所帶來(lái)的娛樂(lè)方式和文化內(nèi)容更加豐富。在滿足更多用戶需求的同時(shí),此類深度合成內(nèi)容的版權(quán)問(wèn)題也成為目前業(yè)界關(guān)注重點(diǎn)。人工智能生成內(nèi)容的發(fā)展趨勢(shì)必然是大眾化、便捷化、平價(jià)化,如何讓其健康發(fā)展成為迫切需要重視的問(wèn)題。本文通過(guò)對(duì)深度合成語(yǔ)音內(nèi)容進(jìn)行研究,厘清背后的生產(chǎn)傳播過(guò)程,深入分析其可能存在的侵權(quán)風(fēng)險(xiǎn)點(diǎn),并根據(jù)已有的相關(guān)法律法規(guī)內(nèi)容探討相關(guān)的應(yīng)對(duì)之策。
一、 深度語(yǔ)音合成內(nèi)容的技術(shù)原理
人工智能已經(jīng)在對(duì)內(nèi)容生產(chǎn)進(jìn)行重新塑造,未來(lái)AIGC 有望成為智能數(shù)字交往的基礎(chǔ)設(shè)施,影響人類生活模式、思想意識(shí)和社會(huì)文明范式的轉(zhuǎn)型變革。(1) 據(jù)了解,雖然網(wǎng)絡(luò)平臺(tái)中的“AI 歌手”數(shù)量逐漸增多,但“AI 孫燕姿”仍最具影響力,相關(guān)視頻作品在Bilibili 平臺(tái)的累計(jì)播放量超過(guò)千萬(wàn)。因此,本文以此為例,分析深度語(yǔ)音合成內(nèi)容的生產(chǎn)與傳播過(guò)程。
(一)深度語(yǔ)音合成
人工智能生成內(nèi)容的基本原理,是人類通過(guò)訓(xùn)練讓機(jī)器根據(jù)算法、模型、規(guī)則生成文本、圖片、聲音、視頻、代碼等內(nèi)容,完成用戶布置的有關(guān)任務(wù)。而深度合成則屬于生成式人工智能的一種特殊應(yīng)用?!吧疃群铣伞笔且环N基于算法指令自動(dòng)化運(yùn)行的合成媒體技術(shù)手段,泛指借助人工智能算法和計(jì)算機(jī)虛擬合成技術(shù)生成數(shù)字化文本內(nèi)容。(2) 隨著技術(shù)不斷發(fā)展,深度語(yǔ)音生成、合成技術(shù)能夠開發(fā)出更具真實(shí)性、實(shí)用性的音頻文本,從而拓展傳播的可能性、增強(qiáng)傳播效果并擁有更加廣泛的應(yīng)用領(lǐng)域。深度合成通常包括三個(gè)主要步驟:第一步是數(shù)據(jù)提取,這一步通過(guò)收集和提取大量相關(guān)數(shù)據(jù),為后續(xù)程序提供充足的輸入源;第二步是模型訓(xùn)練,指通過(guò)深度學(xué)習(xí)等方式尋找一些規(guī)律特征;第三步是合成轉(zhuǎn)換,根據(jù)模型生成新的內(nèi)容,輸出深度合成結(jié)果。
深度語(yǔ)音合成技術(shù)也不例外,通過(guò)收集大量語(yǔ)音數(shù)據(jù)為材料,利用程序自身的深度學(xué)習(xí)算法訓(xùn)練聲學(xué)模型,從而生成特定人群從未說(shuō)過(guò)卻具有逼真效果的語(yǔ)音內(nèi)容。對(duì)于深度語(yǔ)音合成的理解,通常可以分為兩個(gè)部分:深度與合成。“深度”,指深度學(xué)習(xí)。即算法從海量數(shù)據(jù)中學(xué)習(xí),以提高模型的準(zhǔn)確度?!昂铣伞?,指基于海量數(shù)據(jù)的合并結(jié)果,具有高度“類真性”的特征。此類技術(shù)主要分為“語(yǔ)音合成”(Text-to-Speech, 以下簡(jiǎn)稱TTS)和“聲音轉(zhuǎn)換”(VoiceConversion, 以下簡(jiǎn)稱VC) 兩種類型。TTS 技術(shù)也被稱為文本到語(yǔ)音,該技術(shù)旨在根據(jù)輸入的文本生成與目標(biāo)說(shuō)話者真實(shí)語(yǔ)音高度相似的語(yǔ)音波形,使得聽眾感覺該語(yǔ)音是由目標(biāo)說(shuō)話者所發(fā)出。該技術(shù)能夠根據(jù)用戶提供的文本,合成輸出目標(biāo)說(shuō)話者的自然聲音。如AI 孫悟空、AI 佟湘玉和最近爆火的AI 雷軍等,均為該項(xiàng)技術(shù)的應(yīng)用。VC 技術(shù)旨在實(shí)現(xiàn)從原說(shuō)話者到目標(biāo)說(shuō)話者語(yǔ)音特征的遷移,而在此過(guò)程中,保持原有語(yǔ)言信息的完整性與準(zhǔn)確性不變。(3) VC 技術(shù)通過(guò)修改原語(yǔ)音的音頻波形,使其聽起來(lái)像目標(biāo)說(shuō)話者的聲音,即保留原說(shuō)話內(nèi)容但改變了其音色和風(fēng)格。具體來(lái)說(shuō),VC 系統(tǒng)將原說(shuō)話者的錄音作為輸入,并生成與目標(biāo)說(shuō)話者音色極為相似的深度合成音頻,從而實(shí)現(xiàn)原語(yǔ)音特征向目標(biāo)語(yǔ)音特征的轉(zhuǎn)換。(4) 顯然,“AI 歌手”是對(duì)深度語(yǔ)音合成技術(shù)的一次運(yùn)用。通過(guò)深度學(xué)習(xí)技術(shù)對(duì)歌手的音色、唱腔的歸納學(xué)習(xí)形成聲學(xué)模型,再經(jīng)由合成技術(shù)實(shí)現(xiàn)對(duì)目標(biāo)歌曲的翻唱。
(二)AI 歌手的生產(chǎn)傳播之路
平臺(tái)上迅速火爆的AI 歌手,其作品生產(chǎn)具有明顯的深度語(yǔ)音合成技術(shù)特性,生產(chǎn)過(guò)程并不復(fù)雜,操作成本也不高。用戶利用開源軟件,通過(guò)人工智能音色替換技術(shù)(如Sovits4.0)合成目標(biāo)歌手聲音。Sovits4.0 模型是一款基于人工智能技術(shù)的學(xué)唱軟件,能夠通過(guò)自主學(xué)習(xí)和深度學(xué)習(xí)技術(shù)模擬不同歌手的聲音,并在不同音域和曲調(diào)下進(jìn)行演唱。假設(shè)我們需要完成A 對(duì)B 歌曲翻唱,那么具體流程首先是用戶準(zhǔn)備一個(gè)輸入源干聲,即目標(biāo)歌曲中未經(jīng)過(guò)處理的A 的原始人聲。然后,通過(guò)Sovits4.0 模型進(jìn)行推理,替換目標(biāo)歌曲中B 的聲線。最后,用戶只需輸入歌曲的歌詞和曲調(diào),Sovits4.0 模型便能自動(dòng)合成一首歌曲。其中,輸入的A 的人聲樣本需要具有無(wú)損音質(zhì)的人物原聲,即分離提取后的歌手聲音。另外,為確保模型訓(xùn)練的速度和質(zhì)量,要求上傳盡可能多的已經(jīng)分割過(guò)的樣本以形成一個(gè)數(shù)據(jù)集。在模型推理階段,將預(yù)先目標(biāo)翻唱歌曲中的B 的人聲部分提取出來(lái),導(dǎo)入訓(xùn)練好的模型后即可輸出人工智能翻唱的人聲部分。最后,通過(guò)編輯軟件加上伴奏并對(duì)齊,即可完成一個(gè)A 對(duì)B 的深度語(yǔ)音合成作品。
通過(guò)深度語(yǔ)音合成技術(shù)的運(yùn)用,我們甚至可以完成“AI 自我”,實(shí)現(xiàn)對(duì)目標(biāo)歌曲的完美翻唱。顯然,這些內(nèi)容若僅用于個(gè)人娛樂(lè)和欣賞,就不具備侵權(quán)風(fēng)險(xiǎn)。但是,目前各類深度語(yǔ)音合成內(nèi)容已通過(guò)個(gè)人賬號(hào)發(fā)布在各類社交平臺(tái),進(jìn)行廣泛的傳播。甚至有不少網(wǎng)站和平臺(tái)提供的配音服務(wù)中,提供了已生成的各種語(yǔ)音包模型選項(xiàng)以供用戶選擇。那么,在這個(gè)過(guò)程中就產(chǎn)生了一定的侵權(quán)風(fēng)險(xiǎn)。
二、深度語(yǔ)音合成內(nèi)容的侵權(quán)風(fēng)險(xiǎn)
法律上人工智能合成的翻唱歌曲,是人工智能技術(shù)驅(qū)動(dòng)一個(gè)人的聲音來(lái)表演另一個(gè)音樂(lè)作品的過(guò)程,這個(gè)過(guò)程涉及較為復(fù)雜的問(wèn)題。類似于AI 歌手的深度合成內(nèi)容涉及多方主體和權(quán)利,如目標(biāo)歌曲對(duì)應(yīng)的詞曲權(quán)利人的著作權(quán)、演唱者的表演權(quán)和錄音制作者享有的合法權(quán)利。(5)若以非出版制品進(jìn)行模型訓(xùn)練,則主要涉及語(yǔ)音的對(duì)應(yīng)者及其權(quán)利。深度合成內(nèi)容生產(chǎn)的三個(gè)階段——數(shù)據(jù)輸入階段、機(jī)器學(xué)習(xí)階段、數(shù)據(jù)輸出階段,都面臨著一定的侵犯版權(quán)的風(fēng)險(xiǎn),且涉及多方主體及權(quán)利。
(一)數(shù)據(jù)輸入:使用是否合理
數(shù)據(jù)輸入是人工智能內(nèi)容生產(chǎn)的前提。深度合成的音樂(lè)內(nèi)容生產(chǎn)離不開對(duì)真人聲音的獲取與使用。數(shù)字時(shí)代,作品主要以數(shù)據(jù)形式呈現(xiàn)。當(dāng)代版權(quán)法體系內(nèi),蘊(yùn)含了多元化的合理使用制度框架,為各類使用行為提供了充分的制度空間與靈活性?!吨腥A人民共和國(guó)著作權(quán)法》(以下簡(jiǎn)稱《著作權(quán)法》)第四十二條第二款明確指出,對(duì)于已合法錄制成錄音制品的音樂(lè)作品,錄音制作者在不侵犯原著作權(quán)人權(quán)益的前提下,有權(quán)進(jìn)行再錄制,無(wú)需事先征得著作權(quán)人同意,但務(wù)必遵循法律規(guī)定支付相應(yīng)報(bào)酬。若著作權(quán)人明確表明禁止使用的,則該項(xiàng)權(quán)利不得行使。此外,值得注意的是,《著作權(quán)法》所涵蓋的受保護(hù)作品范疇廣泛,涵蓋了文字創(chuàng)作、口頭表達(dá)、音樂(lè)藝術(shù)及美術(shù)設(shè)計(jì)等,而單純的聲音元素,不被直接納入其保護(hù)之列。因此,單純模仿表演者的音色、演唱技巧等特征,并不屬于《著作權(quán)法》保護(hù)的對(duì)象。這表明在AI 歌手制作的數(shù)據(jù)收集階段中,用戶收集大量聲音數(shù)據(jù)并沒有構(gòu)成明顯的版權(quán)侵權(quán)行為。
“合理使用”一般是指在特定情況下,法律允許他人自由使用享有版權(quán)的作品而不必征得權(quán)利人許可的合法行為。(6) 合理使用原則不僅彰顯了公眾對(duì)版權(quán)作品享有的自由利用權(quán)益,同時(shí)也構(gòu)成了法律層面對(duì)著作財(cái)產(chǎn)權(quán)效力的一種必要限制。在此情境下,海量的錄音數(shù)據(jù)被用于“機(jī)器閱讀”,這種接觸和使用的行為是否“正當(dāng)合理”?司法實(shí)踐中,對(duì)于合理使用的界定,其判斷標(biāo)準(zhǔn)超越了單純的使用性質(zhì)與數(shù)量范疇的局限,即不與作品在數(shù)據(jù)處理過(guò)程中被自動(dòng)化、大規(guī)模讀取的方式直接掛鉤,而是基于更為綜合與深入的考量。(7) 然而,利用同一位作者的作品作為算法訓(xùn)練的素材,進(jìn)而產(chǎn)出蘊(yùn)含特定個(gè)性化表達(dá)的新作品,此類行為因涉及對(duì)原作實(shí)質(zhì)性相似性的高度模仿,恐難以被歸入合理使用的范疇之內(nèi)。
(二)機(jī)器學(xué)習(xí):模仿還是創(chuàng)作
基于深度學(xué)習(xí)生成具有作品表達(dá)形式的內(nèi)容,這在某種程度上可視為創(chuàng)作行為。然而,在著作權(quán)法框架內(nèi),其主體資格尚無(wú)法確認(rèn)。根據(jù)《著作權(quán)法》有關(guān)規(guī)定,著作權(quán)人不僅包括作者,也包括依照本法享有著作權(quán)的自然人、法人和非法人組織。然而,人工智能工具由于缺乏主觀意識(shí),不能被認(rèn)定為作者;同樣,正是由于其不具備責(zé)任能力,無(wú)法被視為侵權(quán)者。但是,深度合成內(nèi)容并不能否認(rèn)人的主體地位,算法模型主要反映了操作用戶的創(chuàng)作意圖。這種情況下,深度語(yǔ)音合成內(nèi)容屬于用戶利用智能工具創(chuàng)作的合作性成果。
人工智能訓(xùn)練生成的AI 歌手聲音模型引發(fā)高度關(guān)注,主要因?yàn)槠鋵?duì)歌手聲音的模仿極為相似且具有辨識(shí)度。通過(guò)“學(xué)習(xí)”大量現(xiàn)有作品生成的AI 歌手聲音模型,其發(fā)音、音色、停頓等特征與真人(原作品)存在顯著相似,可能涉嫌侵犯復(fù)制權(quán)和改編權(quán)。盡管音色或唱腔本身不受著作權(quán)法保護(hù),但在商標(biāo)法中,聲音可以注冊(cè)為商標(biāo)。同時(shí),《民法典》對(duì)聲音的保護(hù)類似于對(duì)肖像權(quán)的保護(hù),而肖像權(quán)明確禁止偽造。因此,AI 語(yǔ)音包和AI 歌手中訓(xùn)練語(yǔ)音模型的行為可能涉及侵權(quán)行為。
(三)內(nèi)容輸出:傳播是否侵權(quán)
深度語(yǔ)音合成輸出的內(nèi)容是否具有“可版權(quán)性”?一般而言,智能生成內(nèi)容“可版權(quán)性”主要關(guān)注作品是否具有獨(dú)創(chuàng)性特征。多數(shù)學(xué)者主張人工智能生成內(nèi)容是版權(quán)作品,輸出結(jié)果的版權(quán)作品認(rèn)定應(yīng)基于已經(jīng)生成的表達(dá)結(jié)果,獨(dú)創(chuàng)性的判定對(duì)象只能是作品本身。(8) 版權(quán)制度的核心在于自然人作者的獨(dú)立創(chuàng)作,這一過(guò)程使得作者能夠表達(dá)其思想或情感,并創(chuàng)作出具有獨(dú)創(chuàng)性的作品。因此,作者享有版權(quán),從而鼓勵(lì)多樣化作品的創(chuàng)作和傳播,實(shí)現(xiàn)著作權(quán)法的基本目標(biāo)。
在此類合成內(nèi)容中更多的是模仿和翻唱。在音色方面通過(guò)音頻的深度合成模仿歌手,而翻唱其他歌手的作品本身就可能會(huì)侵犯改編權(quán)。有觀點(diǎn)認(rèn)為,如果此類深度合成音樂(lè)只是用戶自?shī)首詷?lè),不用于商業(yè)盈利,就可以免責(zé)。在上述討論中,這在《著作權(quán)法》層面確實(shí)有“合理使用”制度作為依據(jù),《著作權(quán)法》第二十四條規(guī)定了12 種“合理使用”情形和一項(xiàng)兜底條款。然而,網(wǎng)絡(luò)上的AI 翻唱若通過(guò)直播或者上傳分享等方式傳播,已經(jīng)構(gòu)成了一個(gè)獨(dú)立的“信息網(wǎng)絡(luò)傳播”行為,并不在合理使用制度的豁免范圍內(nèi)。因此,用戶在使用AI 進(jìn)行翻唱的過(guò)程中應(yīng)謹(jǐn)慎,翻唱本身可能被豁免,一旦有了傳播行為,仍然可能構(gòu)成侵權(quán)。而且在創(chuàng)作平臺(tái)上,上傳者的收益項(xiàng)之一是來(lái)自網(wǎng)友的“打賞” 或“投幣”, 存在基礎(chǔ)的“流量變現(xiàn)”路徑和商業(yè)行為。因此,即便是粉絲的二次創(chuàng)作行為,也很難被界定為“不存在盈利”的情況。在傳播過(guò)程中,此類深度語(yǔ)音合成內(nèi)容提到了明星的具體姓名,對(duì)明星的姓名權(quán)可能構(gòu)成侵權(quán)。此外,進(jìn)行翻唱時(shí)需確保符合著作權(quán)法所規(guī)定的翻唱內(nèi)容,否則都需要向作者支付相應(yīng)的費(fèi)用。
國(guó)家網(wǎng)信辦發(fā)文要求,在提供合成人聲、仿聲、人臉替換、姿態(tài)操控等深度合成服務(wù)時(shí),應(yīng)當(dāng)提醒使用者要依法告知被編輯個(gè)人,并獲取其單獨(dú)同意;且合成內(nèi)容如果可能導(dǎo)致混淆或者誤認(rèn),必須在合理位置上進(jìn)行顯著標(biāo)識(shí),交代合成作品的具體信息。在“可追責(zé)”的情況下,一些平臺(tái)開始考慮給AI 內(nèi)容加標(biāo)識(shí),以防止觀者混淆AI 生成的內(nèi)容與真實(shí)內(nèi)容。例如,抖音要求創(chuàng)作者給AI 視頻內(nèi)容打上“AI 生成” 的水印。在AI 歌手的相關(guān)作品中,多數(shù)發(fā)布者發(fā)表免責(zé)聲明,以此來(lái)免除應(yīng)當(dāng)承擔(dān)的法律責(zé)任,但是免責(zé)聲明在司法判例中經(jīng)常不被判定為免責(zé)依據(jù)。(9) 免責(zé)聲明的效力取決于其內(nèi)容和主體行為是否符合法律規(guī)定,而不是由發(fā)表者是否發(fā)布此聲明來(lái)決定。
三、深度語(yǔ)音合成內(nèi)容侵權(quán)治理
在版權(quán)侵權(quán)責(zé)任方面,一個(gè)關(guān)鍵問(wèn)題是如何界定可追究的版權(quán)侵權(quán)行為,以實(shí)現(xiàn)鼓勵(lì)創(chuàng)作、促進(jìn)知識(shí)傳播和文化繁榮、保護(hù)創(chuàng)作自由等多重立法目標(biāo)。(10) 技術(shù)變遷造成版權(quán)侵權(quán)行為呈現(xiàn)出擴(kuò)張態(tài)勢(shì),人工智能對(duì)作品的使用與生產(chǎn)行為都應(yīng)明確納入著作權(quán)限制與例外范圍,能夠一定程度上防止技術(shù)的“寒蟬效應(yīng)”,促進(jìn)公平競(jìng)爭(zhēng),豐富社會(huì)文化。
在歐盟最新修訂的《數(shù)字單一市場(chǎng)版權(quán)指令》中已經(jīng)開始考慮包括深度合成在內(nèi)的技術(shù)發(fā)展對(duì)版權(quán)的影響。美國(guó)目前雖然還沒有明確的立法,但美國(guó)版權(quán)局曾公開征集公眾關(guān)于人工智能作品的版權(quán)問(wèn)題的意見。世界知識(shí)產(chǎn)權(quán)組織提倡應(yīng)認(rèn)真考慮人工智能生成內(nèi)容的保護(hù)范圍,以及人工智能是否能視為版權(quán)的主體。2023 年3 月美國(guó)版權(quán)局推出了關(guān)于生成式人工智能作品版權(quán)的政策聲明,依然堅(jiān)持了版權(quán)法只能保護(hù)“人”的智力創(chuàng)造這項(xiàng)基本原則。我國(guó)《著作權(quán)法》第一條就明確規(guī)定了立法目標(biāo):保護(hù)作者的著作權(quán)和傳播者的鄰接權(quán)(相關(guān)權(quán)),鼓勵(lì)作品的創(chuàng)作和傳播,促進(jìn)文化和科學(xué)事業(yè)的發(fā)展與繁榮。(11) 為技術(shù)正確發(fā)展保駕護(hù)航需要合理的措施進(jìn)行指導(dǎo)與規(guī)范。
(一)細(xì)化合理使用的各個(gè)環(huán)節(jié)
面對(duì)人工智能技術(shù)的發(fā)展,合理使用面臨嚴(yán)峻挑戰(zhàn)。由于“三步檢驗(yàn)法”在立法技術(shù)上的缺陷及其過(guò)于嚴(yán)格的限制解釋,合理使用的空間進(jìn)一步被壓縮和侵蝕。(12) 一方面,提供大量已有版權(quán)作品用于“學(xué)習(xí)”,以及在深度合成創(chuàng)作過(guò)程中對(duì)現(xiàn)有作品的歸納和編輯,均存在侵權(quán)風(fēng)險(xiǎn);另一方面,由于“學(xué)習(xí)”內(nèi)容的海量性,獲取版權(quán)人許可的高成本也使得這一途徑的可行性受到影響。
在人工智能時(shí)代,版權(quán)保護(hù)與合理使用之間的平衡發(fā)生變化。技術(shù)工具成為創(chuàng)作主體的重要部分,傳統(tǒng)的合理使用顯然無(wú)法適用于現(xiàn)狀。應(yīng)當(dāng)重構(gòu)版權(quán)保護(hù)與合理使用的關(guān)系,拓展合理使用的范圍,采用彈性、開放式的合理使用。(13) 深度合成的三個(gè)階段中,“輸入” 和“學(xué)習(xí)” 階段均可被納入合理使用的范疇之內(nèi)。但是在“輸出”階段,則應(yīng)該具體問(wèn)題具體分析。在版權(quán)法的侵權(quán)界定框架內(nèi),若成果與原作品展現(xiàn)出“實(shí)質(zhì)相似性”,則自其創(chuàng)作完成之際,該成果便不再享有合理使用的豁免權(quán),轉(zhuǎn)而置于版權(quán)所有者的專屬權(quán)利控制之下。反之,若產(chǎn)出內(nèi)容與既有作品間缺乏“實(shí)質(zhì)相似性”,且內(nèi)含獨(dú)創(chuàng)性的新穎元素,則依據(jù)版權(quán)法規(guī)定,此類作品不應(yīng)被認(rèn)定為侵權(quán)行為,因其體現(xiàn)了足夠的創(chuàng)新性與差異性。
(二)技術(shù)助力行業(yè)標(biāo)準(zhǔn)的建立
針對(duì)深度語(yǔ)音合成內(nèi)容生成與傳播領(lǐng)域,相關(guān)行業(yè)亟需深化自我規(guī)制,構(gòu)建并優(yōu)化行業(yè)標(biāo)準(zhǔn)體系、職業(yè)操守規(guī)范及自律監(jiān)管機(jī)制。此舉旨在促進(jìn)深度合成服務(wù)提供者與技術(shù)支持者主動(dòng)制定詳盡的業(yè)務(wù)操作規(guī)范,在法律的框架內(nèi)穩(wěn)健運(yùn)營(yíng),并開放式地接受公眾監(jiān)督與評(píng)議。同時(shí)加強(qiáng)行業(yè)內(nèi)部的交流,加強(qiáng)對(duì)相關(guān)法律法規(guī)的解讀。2022 年11 月25日,國(guó)家網(wǎng)信辦正式公布的《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》(以下簡(jiǎn)稱《規(guī)定》)為深度合成服務(wù)提供者施加了標(biāo)識(shí)和顯著標(biāo)識(shí)兩類義務(wù)。然而,其表述在實(shí)際的運(yùn)用過(guò)程中依然缺乏足夠的確定性。目前,各類侵權(quán)更加隱蔽且頻繁,危害深度合成服務(wù)行業(yè)的發(fā)展,因此需要建立統(tǒng)一的行業(yè)標(biāo)準(zhǔn),解決深度合成內(nèi)容侵權(quán)識(shí)別與版權(quán)保護(hù)問(wèn)題。技術(shù)的運(yùn)用有利于降低版權(quán)保護(hù)的成本并且提高效率,監(jiān)測(cè)追蹤技術(shù)是打擊深度合成技術(shù)濫用進(jìn)行證據(jù)收集的重要方式。已有的用于深度合成監(jiān)測(cè)工具的訓(xùn)練不夠完善,監(jiān)測(cè)手段不夠智能。未來(lái),更加普適化地針對(duì)深度合成各類型智能化的鑒別技術(shù),建設(shè)可靠性強(qiáng)、精準(zhǔn)度高的技術(shù)鑒別平臺(tái)。(14)
(三)明確服務(wù)提供者責(zé)任義務(wù)
《規(guī)定》第七條、第八條中明確指出深度合成服務(wù)提供者的主體責(zé)任與應(yīng)盡義務(wù),如完善平臺(tái)與創(chuàng)作者的服務(wù)協(xié)議,在內(nèi)容上傳前要求創(chuàng)作者自覺對(duì)內(nèi)容進(jìn)行標(biāo)識(shí)?!兑?guī)定》第二十三條提到,提供深度合成服務(wù)的組織、個(gè)人屬于深度合成服務(wù)提供者。個(gè)體的深度合成使用者并不能孤立地傳播作品。因此,不論是深度合成服務(wù)的提供者,還是兼具傳播能力與輿論屬性的媒體平臺(tái),都應(yīng)承擔(dān)相應(yīng)的主體責(zé)任。此外,通過(guò)這個(gè)平臺(tái)觀察可以看出,目前仍存在部分深度合成內(nèi)容識(shí)別不詳盡、表示不明顯的問(wèn)題,網(wǎng)絡(luò)中存在大量難辨真假的深度語(yǔ)音合成內(nèi)容,危害社會(huì)秩序、侵害他人合法權(quán)益。對(duì)此,深度合成服務(wù)的提供者應(yīng)依法對(duì)服務(wù)使用者的身份信息進(jìn)行嚴(yán)格核實(shí)與認(rèn)證;同時(shí),應(yīng)實(shí)施技術(shù)手段,在不干擾用戶體驗(yàn)的前提下,嵌入清晰可辨的標(biāo)識(shí)信息,以維護(hù)內(nèi)容的透明性與可追溯性。深度合成服務(wù)者應(yīng)設(shè)置用戶申訴和投訴入口,透明化處理。平臺(tái)作為生成式人工智能內(nèi)容傳播的重要通道,應(yīng)當(dāng)率先向治理主體身份轉(zhuǎn)變,可以規(guī)約用戶主動(dòng)做合成告知,建立“標(biāo)注”規(guī)則以及披露核查機(jī)制,建立“失信”數(shù)字臺(tái)賬記錄,做好創(chuàng)作者的個(gè)人信用評(píng)估。
四、結(jié)語(yǔ)
深度語(yǔ)音合成技術(shù)在音樂(lè)領(lǐng)域甚至更廣泛的休閑娛樂(lè)領(lǐng)域取得的優(yōu)勢(shì)發(fā)展,是對(duì)人工智能技術(shù)的靈活運(yùn)用及其產(chǎn)生的持續(xù)效用。目前,無(wú)論AI 歌手是否尊重了歌手的意愿和權(quán)利,是否會(huì)對(duì)真實(shí)音樂(lè)創(chuàng)作者產(chǎn)生不公平的競(jìng)爭(zhēng),即使確實(shí)存在涉及的侵權(quán)行為,“我們無(wú)法否定媒介化生存時(shí)代的存在,也無(wú)法阻止傳播技術(shù)的前進(jìn)?!保?5) 我們不能阻礙技術(shù)的發(fā)展,而應(yīng)該引導(dǎo)技術(shù)發(fā)展。通過(guò)我國(guó)先后頒布的相關(guān)法律法規(guī)可以看出,我國(guó)鼓勵(lì)各類生成式人工智能技術(shù)在各行業(yè)、各領(lǐng)域的創(chuàng)新應(yīng)用,采取“寬進(jìn)寬出”的結(jié)構(gòu)原則。同時(shí),類似AI 語(yǔ)音包因其獨(dú)特趣味性也大受好評(píng),大量用戶甚至新聞媒體都在視頻制作中進(jìn)行使用和傳播。在符號(hào)價(jià)值、快樂(lè)原則高度凸顯的當(dāng)今社會(huì),隨著重視用戶體驗(yàn)和貼近消費(fèi)者個(gè)性化需求的社會(huì)文化生態(tài)逐步形成,具有獨(dú)特個(gè)性和高度便利性的深度語(yǔ)音合成技術(shù)將迅速贏得年輕用戶群體的接受與青睞。因此,既要不斷落實(shí)和規(guī)范保護(hù)作品的版權(quán),也不能阻礙社會(huì)文化創(chuàng)作的繁榮發(fā)展,要引導(dǎo)深度合成技術(shù)的良性發(fā)展,激發(fā)創(chuàng)作和創(chuàng)新活力,推動(dòng)文化市場(chǎng)發(fā)展。
(作者王歡妮系重慶師范大學(xué)新聞與傳媒學(xué)院教授;鐘艷系重慶師范大學(xué)新聞與傳媒學(xué)院碩士研究生)