亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

深度語(yǔ)音合成內(nèi)容的侵權(quán)風(fēng)險(xiǎn)和治理研究

2024-02-18 00:00:00王歡妮鐘艷

創(chuàng)意中國(guó) 2024年4期

摘要：人工智能技術(shù)具有深刻變革內(nèi)容生產(chǎn)范式的能力，正成為內(nèi)容生產(chǎn)的重要驅(qū)動(dòng)力。深度語(yǔ)音合成作為人工智能應(yīng)用的重要領(lǐng)域，拓展了聲音的多樣性和制作模式，為用戶提供了豐富的聽覺體驗(yàn)。然而，這也帶來(lái)一系列潛在的侵權(quán)風(fēng)險(xiǎn)。為此，本文通過(guò)研究分析此類深度語(yǔ)音合成內(nèi)容的使用現(xiàn)狀、技術(shù)原理及應(yīng)用類型，就其生產(chǎn)傳播過(guò)程可能涉及的侵權(quán)主體與侵犯權(quán)利等法律問(wèn)題進(jìn)行闡述，并提出應(yīng)對(duì)治理策略，確保深度語(yǔ)音合成技術(shù)的健康發(fā)展，為未來(lái)內(nèi)容生產(chǎn)拓展更廣闊的空間。

關(guān)鍵詞：深度語(yǔ)音合成；版權(quán)；AI 歌手；侵權(quán)治理

俗話說(shuō)，眼見為實(shí)，耳聽為虛。如今，在技術(shù)支持下“生產(chǎn)”的聲音更是難辨真假。2023 年4月，歌曲《Heart On My Sleeve》由聲音訓(xùn)練模型制成并在Tiktok上迅速躥紅。2023 年4 月12 日，UP 主“陳墨瞳1995”在Bilibili 平臺(tái)發(fā)布了第一則AI 孫燕姿翻唱作品，4 月14 日發(fā)布的AI 孫燕姿翻唱周杰倫《發(fā)如雪》視頻播放量已超過(guò)300 萬(wàn)，點(diǎn)贊、投幣、收藏、轉(zhuǎn)發(fā)量均達(dá)數(shù)萬(wàn)。它們的相似之處在于均擁有與原歌手極其相似的聲音特征。據(jù)不完全統(tǒng)計(jì)，各大社交平臺(tái)中此類模仿真人的“AI 歌手”數(shù)量已達(dá)近百個(gè)，“AI 那英”“AI 蔡依林”“AI TaylorSwift”等先后問(wèn)世，國(guó)內(nèi)外流行音樂(lè)領(lǐng)域的知名歌手基本都擁有了“AI 版本”。

由人工智能技術(shù)合成的音樂(lè)內(nèi)容由此進(jìn)入了更廣范圍的公眾視野，可見技術(shù)創(chuàng)新所帶來(lái)的娛樂(lè)方式和文化內(nèi)容更加豐富。在滿足更多用戶需求的同時(shí)，此類深度合成內(nèi)容的版權(quán)問(wèn)題也成為目前業(yè)界關(guān)注重點(diǎn)。人工智能生成內(nèi)容的發(fā)展趨勢(shì)必然是大眾化、便捷化、平價(jià)化，如何讓其健康發(fā)展成為迫切需要重視的問(wèn)題。本文通過(guò)對(duì)深度合成語(yǔ)音內(nèi)容進(jìn)行研究，厘清背后的生產(chǎn)傳播過(guò)程，深入分析其可能存在的侵權(quán)風(fēng)險(xiǎn)點(diǎn)，并根據(jù)已有的相關(guān)法律法規(guī)內(nèi)容探討相關(guān)的應(yīng)對(duì)之策。

一、深度語(yǔ)音合成內(nèi)容的技術(shù)原理

人工智能已經(jīng)在對(duì)內(nèi)容生產(chǎn)進(jìn)行重新塑造，未來(lái)AIGC 有望成為智能數(shù)字交往的基礎(chǔ)設(shè)施，影響人類生活模式、思想意識(shí)和社會(huì)文明范式的轉(zhuǎn)型變革。（1）據(jù)了解，雖然網(wǎng)絡(luò)平臺(tái)中的“AI 歌手”數(shù)量逐漸增多，但“AI 孫燕姿”仍最具影響力，相關(guān)視頻作品在Bilibili 平臺(tái)的累計(jì)播放量超過(guò)千萬(wàn)。因此，本文以此為例，分析深度語(yǔ)音合成內(nèi)容的生產(chǎn)與傳播過(guò)程。

（一）深度語(yǔ)音合成

人工智能生成內(nèi)容的基本原理，是人類通過(guò)訓(xùn)練讓機(jī)器根據(jù)算法、模型、規(guī)則生成文本、圖片、聲音、視頻、代碼等內(nèi)容，完成用戶布置的有關(guān)任務(wù)。而深度合成則屬于生成式人工智能的一種特殊應(yīng)用?！吧疃群铣伞笔且环N基于算法指令自動(dòng)化運(yùn)行的合成媒體技術(shù)手段，泛指借助人工智能算法和計(jì)算機(jī)虛擬合成技術(shù)生成數(shù)字化文本內(nèi)容。（2）隨著技術(shù)不斷發(fā)展，深度語(yǔ)音生成、合成技術(shù)能夠開發(fā)出更具真實(shí)性、實(shí)用性的音頻文本，從而拓展傳播的可能性、增強(qiáng)傳播效果并擁有更加廣泛的應(yīng)用領(lǐng)域。深度合成通常包括三個(gè)主要步驟：第一步是數(shù)據(jù)提取，這一步通過(guò)收集和提取大量相關(guān)數(shù)據(jù)，為后續(xù)程序提供充足的輸入源；第二步是模型訓(xùn)練，指通過(guò)深度學(xué)習(xí)等方式尋找一些規(guī)律特征；第三步是合成轉(zhuǎn)換，根據(jù)模型生成新的內(nèi)容，輸出深度合成結(jié)果。

深度語(yǔ)音合成技術(shù)也不例外，通過(guò)收集大量語(yǔ)音數(shù)據(jù)為材料，利用程序自身的深度學(xué)習(xí)算法訓(xùn)練聲學(xué)模型，從而生成特定人群從未說(shuō)過(guò)卻具有逼真效果的語(yǔ)音內(nèi)容。對(duì)于深度語(yǔ)音合成的理解，通常可以分為兩個(gè)部分：深度與合成。“深度”，指深度學(xué)習(xí)。即算法從海量數(shù)據(jù)中學(xué)習(xí)，以提高模型的準(zhǔn)確度?！昂铣伞?，指基于海量數(shù)據(jù)的合并結(jié)果，具有高度“類真性”的特征。此類技術(shù)主要分為“語(yǔ)音合成”（Text-to-Speech，以下簡(jiǎn)稱TTS）和“聲音轉(zhuǎn)換”（VoiceConversion，以下簡(jiǎn)稱VC）兩種類型。TTS 技術(shù)也被稱為文本到語(yǔ)音，該技術(shù)旨在根據(jù)輸入的文本生成與目標(biāo)說(shuō)話者真實(shí)語(yǔ)音高度相似的語(yǔ)音波形，使得聽眾感覺該語(yǔ)音是由目標(biāo)說(shuō)話者所發(fā)出。該技術(shù)能夠根據(jù)用戶提供的文本，合成輸出目標(biāo)說(shuō)話者的自然聲音。如AI 孫悟空、AI 佟湘玉和最近爆火的AI 雷軍等，均為該項(xiàng)技術(shù)的應(yīng)用。VC 技術(shù)旨在實(shí)現(xiàn)從原說(shuō)話者到目標(biāo)說(shuō)話者語(yǔ)音特征的遷移，而在此過(guò)程中，保持原有語(yǔ)言信息的完整性與準(zhǔn)確性不變。（3） VC 技術(shù)通過(guò)修改原語(yǔ)音的音頻波形，使其聽起來(lái)像目標(biāo)說(shuō)話者的聲音，即保留原說(shuō)話內(nèi)容但改變了其音色和風(fēng)格。具體來(lái)說(shuō)，VC 系統(tǒng)將原說(shuō)話者的錄音作為輸入，并生成與目標(biāo)說(shuō)話者音色極為相似的深度合成音頻，從而實(shí)現(xiàn)原語(yǔ)音特征向目標(biāo)語(yǔ)音特征的轉(zhuǎn)換。（4）顯然，“AI 歌手”是對(duì)深度語(yǔ)音合成技術(shù)的一次運(yùn)用。通過(guò)深度學(xué)習(xí)技術(shù)對(duì)歌手的音色、唱腔的歸納學(xué)習(xí)形成聲學(xué)模型，再經(jīng)由合成技術(shù)實(shí)現(xiàn)對(duì)目標(biāo)歌曲的翻唱。

（二）AI 歌手的生產(chǎn)傳播之路

平臺(tái)上迅速火爆的AI 歌手，其作品生產(chǎn)具有明顯的深度語(yǔ)音合成技術(shù)特性，生產(chǎn)過(guò)程并不復(fù)雜，操作成本也不高。用戶利用開源軟件，通過(guò)人工智能音色替換技術(shù)（如Sovits4.0）合成目標(biāo)歌手聲音。Sovits4.0 模型是一款基于人工智能技術(shù)的學(xué)唱軟件，能夠通過(guò)自主學(xué)習(xí)和深度學(xué)習(xí)技術(shù)模擬不同歌手的聲音，并在不同音域和曲調(diào)下進(jìn)行演唱。假設(shè)我們需要完成A 對(duì)B 歌曲翻唱，那么具體流程首先是用戶準(zhǔn)備一個(gè)輸入源干聲，即目標(biāo)歌曲中未經(jīng)過(guò)處理的A 的原始人聲。然后，通過(guò)Sovits4.0 模型進(jìn)行推理，替換目標(biāo)歌曲中B 的聲線。最后，用戶只需輸入歌曲的歌詞和曲調(diào)，Sovits4.0 模型便能自動(dòng)合成一首歌曲。其中，輸入的A 的人聲樣本需要具有無(wú)損音質(zhì)的人物原聲，即分離提取后的歌手聲音。另外，為確保模型訓(xùn)練的速度和質(zhì)量，要求上傳盡可能多的已經(jīng)分割過(guò)的樣本以形成一個(gè)數(shù)據(jù)集。在模型推理階段，將預(yù)先目標(biāo)翻唱歌曲中的B 的人聲部分提取出來(lái)，導(dǎo)入訓(xùn)練好的模型后即可輸出人工智能翻唱的人聲部分。最后，通過(guò)編輯軟件加上伴奏并對(duì)齊，即可完成一個(gè)A 對(duì)B 的深度語(yǔ)音合成作品。

通過(guò)深度語(yǔ)音合成技術(shù)的運(yùn)用，我們甚至可以完成“AI 自我”，實(shí)現(xiàn)對(duì)目標(biāo)歌曲的完美翻唱。顯然，這些內(nèi)容若僅用于個(gè)人娛樂(lè)和欣賞，就不具備侵權(quán)風(fēng)險(xiǎn)。但是，目前各類深度語(yǔ)音合成內(nèi)容已通過(guò)個(gè)人賬號(hào)發(fā)布在各類社交平臺(tái)，進(jìn)行廣泛的傳播。甚至有不少網(wǎng)站和平臺(tái)提供的配音服務(wù)中，提供了已生成的各種語(yǔ)音包模型選項(xiàng)以供用戶選擇。那么，在這個(gè)過(guò)程中就產(chǎn)生了一定的侵權(quán)風(fēng)險(xiǎn)。

二、深度語(yǔ)音合成內(nèi)容的侵權(quán)風(fēng)險(xiǎn)

法律上人工智能合成的翻唱歌曲，是人工智能技術(shù)驅(qū)動(dòng)一個(gè)人的聲音來(lái)表演另一個(gè)音樂(lè)作品的過(guò)程，這個(gè)過(guò)程涉及較為復(fù)雜的問(wèn)題。類似于AI 歌手的深度合成內(nèi)容涉及多方主體和權(quán)利，如目標(biāo)歌曲對(duì)應(yīng)的詞曲權(quán)利人的著作權(quán)、演唱者的表演權(quán)和錄音制作者享有的合法權(quán)利。（5）若以非出版制品進(jìn)行模型訓(xùn)練，則主要涉及語(yǔ)音的對(duì)應(yīng)者及其權(quán)利。深度合成內(nèi)容生產(chǎn)的三個(gè)階段——數(shù)據(jù)輸入階段、機(jī)器學(xué)習(xí)階段、數(shù)據(jù)輸出階段，都面臨著一定的侵犯版權(quán)的風(fēng)險(xiǎn)，且涉及多方主體及權(quán)利。

（一）數(shù)據(jù)輸入：使用是否合理

數(shù)據(jù)輸入是人工智能內(nèi)容生產(chǎn)的前提。深度合成的音樂(lè)內(nèi)容生產(chǎn)離不開對(duì)真人聲音的獲取與使用。數(shù)字時(shí)代，作品主要以數(shù)據(jù)形式呈現(xiàn)。當(dāng)代版權(quán)法體系內(nèi)，蘊(yùn)含了多元化的合理使用制度框架，為各類使用行為提供了充分的制度空間與靈活性?！吨腥A人民共和國(guó)著作權(quán)法》（以下簡(jiǎn)稱《著作權(quán)法》）第四十二條第二款明確指出，對(duì)于已合法錄制成錄音制品的音樂(lè)作品，錄音制作者在不侵犯原著作權(quán)人權(quán)益的前提下，有權(quán)進(jìn)行再錄制，無(wú)需事先征得著作權(quán)人同意，但務(wù)必遵循法律規(guī)定支付相應(yīng)報(bào)酬。若著作權(quán)人明確表明禁止使用的，則該項(xiàng)權(quán)利不得行使。此外，值得注意的是，《著作權(quán)法》所涵蓋的受保護(hù)作品范疇廣泛，涵蓋了文字創(chuàng)作、口頭表達(dá)、音樂(lè)藝術(shù)及美術(shù)設(shè)計(jì)等，而單純的聲音元素，不被直接納入其保護(hù)之列。因此，單純模仿表演者的音色、演唱技巧等特征，并不屬于《著作權(quán)法》保護(hù)的對(duì)象。這表明在AI 歌手制作的數(shù)據(jù)收集階段中，用戶收集大量聲音數(shù)據(jù)并沒有構(gòu)成明顯的版權(quán)侵權(quán)行為。

“合理使用”一般是指在特定情況下，法律允許他人自由使用享有版權(quán)的作品而不必征得權(quán)利人許可的合法行為。（6）合理使用原則不僅彰顯了公眾對(duì)版權(quán)作品享有的自由利用權(quán)益，同時(shí)也構(gòu)成了法律層面對(duì)著作財(cái)產(chǎn)權(quán)效力的一種必要限制。在此情境下，海量的錄音數(shù)據(jù)被用于“機(jī)器閱讀”，這種接觸和使用的行為是否“正當(dāng)合理”？司法實(shí)踐中，對(duì)于合理使用的界定，其判斷標(biāo)準(zhǔn)超越了單純的使用性質(zhì)與數(shù)量范疇的局限，即不與作品在數(shù)據(jù)處理過(guò)程中被自動(dòng)化、大規(guī)模讀取的方式直接掛鉤，而是基于更為綜合與深入的考量。（7）然而，利用同一位作者的作品作為算法訓(xùn)練的素材，進(jìn)而產(chǎn)出蘊(yùn)含特定個(gè)性化表達(dá)的新作品，此類行為因涉及對(duì)原作實(shí)質(zhì)性相似性的高度模仿，恐難以被歸入合理使用的范疇之內(nèi)。

（二）機(jī)器學(xué)習(xí)：模仿還是創(chuàng)作

基于深度學(xué)習(xí)生成具有作品表達(dá)形式的內(nèi)容，這在某種程度上可視為創(chuàng)作行為。然而，在著作權(quán)法框架內(nèi)，其主體資格尚無(wú)法確認(rèn)。根據(jù)《著作權(quán)法》有關(guān)規(guī)定，著作權(quán)人不僅包括作者，也包括依照本法享有著作權(quán)的自然人、法人和非法人組織。然而，人工智能工具由于缺乏主觀意識(shí)，不能被認(rèn)定為作者；同樣，正是由于其不具備責(zé)任能力，無(wú)法被視為侵權(quán)者。但是，深度合成內(nèi)容并不能否認(rèn)人的主體地位，算法模型主要反映了操作用戶的創(chuàng)作意圖。這種情況下，深度語(yǔ)音合成內(nèi)容屬于用戶利用智能工具創(chuàng)作的合作性成果。

人工智能訓(xùn)練生成的AI 歌手聲音模型引發(fā)高度關(guān)注，主要因?yàn)槠鋵?duì)歌手聲音的模仿極為相似且具有辨識(shí)度。通過(guò)“學(xué)習(xí)”大量現(xiàn)有作品生成的AI 歌手聲音模型，其發(fā)音、音色、停頓等特征與真人（原作品）存在顯著相似，可能涉嫌侵犯復(fù)制權(quán)和改編權(quán)。盡管音色或唱腔本身不受著作權(quán)法保護(hù)，但在商標(biāo)法中，聲音可以注冊(cè)為商標(biāo)。同時(shí)，《民法典》對(duì)聲音的保護(hù)類似于對(duì)肖像權(quán)的保護(hù)，而肖像權(quán)明確禁止偽造。因此，AI 語(yǔ)音包和AI 歌手中訓(xùn)練語(yǔ)音模型的行為可能涉及侵權(quán)行為。

（三）內(nèi)容輸出：傳播是否侵權(quán)

深度語(yǔ)音合成輸出的內(nèi)容是否具有“可版權(quán)性”？一般而言，智能生成內(nèi)容“可版權(quán)性”主要關(guān)注作品是否具有獨(dú)創(chuàng)性特征。多數(shù)學(xué)者主張人工智能生成內(nèi)容是版權(quán)作品，輸出結(jié)果的版權(quán)作品認(rèn)定應(yīng)基于已經(jīng)生成的表達(dá)結(jié)果，獨(dú)創(chuàng)性的判定對(duì)象只能是作品本身。（8）版權(quán)制度的核心在于自然人作者的獨(dú)立創(chuàng)作，這一過(guò)程使得作者能夠表達(dá)其思想或情感，并創(chuàng)作出具有獨(dú)創(chuàng)性的作品。因此，作者享有版權(quán)，從而鼓勵(lì)多樣化作品的創(chuàng)作和傳播，實(shí)現(xiàn)著作權(quán)法的基本目標(biāo)。

在此類合成內(nèi)容中更多的是模仿和翻唱。在音色方面通過(guò)音頻的深度合成模仿歌手，而翻唱其他歌手的作品本身就可能會(huì)侵犯改編權(quán)。有觀點(diǎn)認(rèn)為，如果此類深度合成音樂(lè)只是用戶自?shī)首詷?lè)，不用于商業(yè)盈利，就可以免責(zé)。在上述討論中，這在《著作權(quán)法》層面確實(shí)有“合理使用”制度作為依據(jù)，《著作權(quán)法》第二十四條規(guī)定了12 種“合理使用”情形和一項(xiàng)兜底條款。然而，網(wǎng)絡(luò)上的AI 翻唱若通過(guò)直播或者上傳分享等方式傳播，已經(jīng)構(gòu)成了一個(gè)獨(dú)立的“信息網(wǎng)絡(luò)傳播”行為，并不在合理使用制度的豁免范圍內(nèi)。因此，用戶在使用AI 進(jìn)行翻唱的過(guò)程中應(yīng)謹(jǐn)慎，翻唱本身可能被豁免，一旦有了傳播行為，仍然可能構(gòu)成侵權(quán)。而且在創(chuàng)作平臺(tái)上，上傳者的收益項(xiàng)之一是來(lái)自網(wǎng)友的“打賞” 或“投幣”，存在基礎(chǔ)的“流量變現(xiàn)”路徑和商業(yè)行為。因此，即便是粉絲的二次創(chuàng)作行為，也很難被界定為“不存在盈利”的情況。在傳播過(guò)程中，此類深度語(yǔ)音合成內(nèi)容提到了明星的具體姓名，對(duì)明星的姓名權(quán)可能構(gòu)成侵權(quán)。此外，進(jìn)行翻唱時(shí)需確保符合著作權(quán)法所規(guī)定的翻唱內(nèi)容，否則都需要向作者支付相應(yīng)的費(fèi)用。

國(guó)家網(wǎng)信辦發(fā)文要求，在提供合成人聲、仿聲、人臉替換、姿態(tài)操控等深度合成服務(wù)時(shí)，應(yīng)當(dāng)提醒使用者要依法告知被編輯個(gè)人，并獲取其單獨(dú)同意；且合成內(nèi)容如果可能導(dǎo)致混淆或者誤認(rèn)，必須在合理位置上進(jìn)行顯著標(biāo)識(shí)，交代合成作品的具體信息。在“可追責(zé)”的情況下，一些平臺(tái)開始考慮給AI 內(nèi)容加標(biāo)識(shí)，以防止觀者混淆AI 生成的內(nèi)容與真實(shí)內(nèi)容。例如，抖音要求創(chuàng)作者給AI 視頻內(nèi)容打上“AI 生成” 的水印。在AI 歌手的相關(guān)作品中，多數(shù)發(fā)布者發(fā)表免責(zé)聲明，以此來(lái)免除應(yīng)當(dāng)承擔(dān)的法律責(zé)任，但是免責(zé)聲明在司法判例中經(jīng)常不被判定為免責(zé)依據(jù)。（9）免責(zé)聲明的效力取決于其內(nèi)容和主體行為是否符合法律規(guī)定，而不是由發(fā)表者是否發(fā)布此聲明來(lái)決定。

三、深度語(yǔ)音合成內(nèi)容侵權(quán)治理

在版權(quán)侵權(quán)責(zé)任方面，一個(gè)關(guān)鍵問(wèn)題是如何界定可追究的版權(quán)侵權(quán)行為，以實(shí)現(xiàn)鼓勵(lì)創(chuàng)作、促進(jìn)知識(shí)傳播和文化繁榮、保護(hù)創(chuàng)作自由等多重立法目標(biāo)。（10）技術(shù)變遷造成版權(quán)侵權(quán)行為呈現(xiàn)出擴(kuò)張態(tài)勢(shì)，人工智能對(duì)作品的使用與生產(chǎn)行為都應(yīng)明確納入著作權(quán)限制與例外范圍，能夠一定程度上防止技術(shù)的“寒蟬效應(yīng)”，促進(jìn)公平競(jìng)爭(zhēng)，豐富社會(huì)文化。

在歐盟最新修訂的《數(shù)字單一市場(chǎng)版權(quán)指令》中已經(jīng)開始考慮包括深度合成在內(nèi)的技術(shù)發(fā)展對(duì)版權(quán)的影響。美國(guó)目前雖然還沒有明確的立法，但美國(guó)版權(quán)局曾公開征集公眾關(guān)于人工智能作品的版權(quán)問(wèn)題的意見。世界知識(shí)產(chǎn)權(quán)組織提倡應(yīng)認(rèn)真考慮人工智能生成內(nèi)容的保護(hù)范圍，以及人工智能是否能視為版權(quán)的主體。2023 年3 月美國(guó)版權(quán)局推出了關(guān)于生成式人工智能作品版權(quán)的政策聲明，依然堅(jiān)持了版權(quán)法只能保護(hù)“人”的智力創(chuàng)造這項(xiàng)基本原則。我國(guó)《著作權(quán)法》第一條就明確規(guī)定了立法目標(biāo)：保護(hù)作者的著作權(quán)和傳播者的鄰接權(quán)（相關(guān)權(quán)），鼓勵(lì)作品的創(chuàng)作和傳播，促進(jìn)文化和科學(xué)事業(yè)的發(fā)展與繁榮。（11）為技術(shù)正確發(fā)展保駕護(hù)航需要合理的措施進(jìn)行指導(dǎo)與規(guī)范。

（一）細(xì)化合理使用的各個(gè)環(huán)節(jié)

面對(duì)人工智能技術(shù)的發(fā)展，合理使用面臨嚴(yán)峻挑戰(zhàn)。由于“三步檢驗(yàn)法”在立法技術(shù)上的缺陷及其過(guò)于嚴(yán)格的限制解釋，合理使用的空間進(jìn)一步被壓縮和侵蝕。（12）一方面，提供大量已有版權(quán)作品用于“學(xué)習(xí)”，以及在深度合成創(chuàng)作過(guò)程中對(duì)現(xiàn)有作品的歸納和編輯，均存在侵權(quán)風(fēng)險(xiǎn)；另一方面，由于“學(xué)習(xí)”內(nèi)容的海量性，獲取版權(quán)人許可的高成本也使得這一途徑的可行性受到影響。

在人工智能時(shí)代，版權(quán)保護(hù)與合理使用之間的平衡發(fā)生變化。技術(shù)工具成為創(chuàng)作主體的重要部分，傳統(tǒng)的合理使用顯然無(wú)法適用于現(xiàn)狀。應(yīng)當(dāng)重構(gòu)版權(quán)保護(hù)與合理使用的關(guān)系，拓展合理使用的范圍，采用彈性、開放式的合理使用。（13）深度合成的三個(gè)階段中，“輸入” 和“學(xué)習(xí)” 階段均可被納入合理使用的范疇之內(nèi)。但是在“輸出”階段，則應(yīng)該具體問(wèn)題具體分析。在版權(quán)法的侵權(quán)界定框架內(nèi)，若成果與原作品展現(xiàn)出“實(shí)質(zhì)相似性”，則自其創(chuàng)作完成之際，該成果便不再享有合理使用的豁免權(quán)，轉(zhuǎn)而置于版權(quán)所有者的專屬權(quán)利控制之下。反之，若產(chǎn)出內(nèi)容與既有作品間缺乏“實(shí)質(zhì)相似性”，且內(nèi)含獨(dú)創(chuàng)性的新穎元素，則依據(jù)版權(quán)法規(guī)定，此類作品不應(yīng)被認(rèn)定為侵權(quán)行為，因其體現(xiàn)了足夠的創(chuàng)新性與差異性。

（二）技術(shù)助力行業(yè)標(biāo)準(zhǔn)的建立

針對(duì)深度語(yǔ)音合成內(nèi)容生成與傳播領(lǐng)域，相關(guān)行業(yè)亟需深化自我規(guī)制，構(gòu)建并優(yōu)化行業(yè)標(biāo)準(zhǔn)體系、職業(yè)操守規(guī)范及自律監(jiān)管機(jī)制。此舉旨在促進(jìn)深度合成服務(wù)提供者與技術(shù)支持者主動(dòng)制定詳盡的業(yè)務(wù)操作規(guī)范，在法律的框架內(nèi)穩(wěn)健運(yùn)營(yíng)，并開放式地接受公眾監(jiān)督與評(píng)議。同時(shí)加強(qiáng)行業(yè)內(nèi)部的交流，加強(qiáng)對(duì)相關(guān)法律法規(guī)的解讀。2022 年11 月25日，國(guó)家網(wǎng)信辦正式公布的《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》（以下簡(jiǎn)稱《規(guī)定》）為深度合成服務(wù)提供者施加了標(biāo)識(shí)和顯著標(biāo)識(shí)兩類義務(wù)。然而，其表述在實(shí)際的運(yùn)用過(guò)程中依然缺乏足夠的確定性。目前，各類侵權(quán)更加隱蔽且頻繁，危害深度合成服務(wù)行業(yè)的發(fā)展，因此需要建立統(tǒng)一的行業(yè)標(biāo)準(zhǔn)，解決深度合成內(nèi)容侵權(quán)識(shí)別與版權(quán)保護(hù)問(wèn)題。技術(shù)的運(yùn)用有利于降低版權(quán)保護(hù)的成本并且提高效率，監(jiān)測(cè)追蹤技術(shù)是打擊深度合成技術(shù)濫用進(jìn)行證據(jù)收集的重要方式。已有的用于深度合成監(jiān)測(cè)工具的訓(xùn)練不夠完善，監(jiān)測(cè)手段不夠智能。未來(lái)，更加普適化地針對(duì)深度合成各類型智能化的鑒別技術(shù)，建設(shè)可靠性強(qiáng)、精準(zhǔn)度高的技術(shù)鑒別平臺(tái)。（14）

（三）明確服務(wù)提供者責(zé)任義務(wù)

《規(guī)定》第七條、第八條中明確指出深度合成服務(wù)提供者的主體責(zé)任與應(yīng)盡義務(wù)，如完善平臺(tái)與創(chuàng)作者的服務(wù)協(xié)議，在內(nèi)容上傳前要求創(chuàng)作者自覺對(duì)內(nèi)容進(jìn)行標(biāo)識(shí)?！兑?guī)定》第二十三條提到，提供深度合成服務(wù)的組織、個(gè)人屬于深度合成服務(wù)提供者。個(gè)體的深度合成使用者并不能孤立地傳播作品。因此，不論是深度合成服務(wù)的提供者，還是兼具傳播能力與輿論屬性的媒體平臺(tái)，都應(yīng)承擔(dān)相應(yīng)的主體責(zé)任。此外，通過(guò)這個(gè)平臺(tái)觀察可以看出，目前仍存在部分深度合成內(nèi)容識(shí)別不詳盡、表示不明顯的問(wèn)題，網(wǎng)絡(luò)中存在大量難辨真假的深度語(yǔ)音合成內(nèi)容，危害社會(huì)秩序、侵害他人合法權(quán)益。對(duì)此，深度合成服務(wù)的提供者應(yīng)依法對(duì)服務(wù)使用者的身份信息進(jìn)行嚴(yán)格核實(shí)與認(rèn)證；同時(shí)，應(yīng)實(shí)施技術(shù)手段，在不干擾用戶體驗(yàn)的前提下，嵌入清晰可辨的標(biāo)識(shí)信息，以維護(hù)內(nèi)容的透明性與可追溯性。深度合成服務(wù)者應(yīng)設(shè)置用戶申訴和投訴入口，透明化處理。平臺(tái)作為生成式人工智能內(nèi)容傳播的重要通道，應(yīng)當(dāng)率先向治理主體身份轉(zhuǎn)變，可以規(guī)約用戶主動(dòng)做合成告知，建立“標(biāo)注”規(guī)則以及披露核查機(jī)制，建立“失信”數(shù)字臺(tái)賬記錄，做好創(chuàng)作者的個(gè)人信用評(píng)估。

四、結(jié)語(yǔ)

深度語(yǔ)音合成技術(shù)在音樂(lè)領(lǐng)域甚至更廣泛的休閑娛樂(lè)領(lǐng)域取得的優(yōu)勢(shì)發(fā)展，是對(duì)人工智能技術(shù)的靈活運(yùn)用及其產(chǎn)生的持續(xù)效用。目前，無(wú)論AI 歌手是否尊重了歌手的意愿和權(quán)利，是否會(huì)對(duì)真實(shí)音樂(lè)創(chuàng)作者產(chǎn)生不公平的競(jìng)爭(zhēng)，即使確實(shí)存在涉及的侵權(quán)行為，“我們無(wú)法否定媒介化生存時(shí)代的存在，也無(wú)法阻止傳播技術(shù)的前進(jìn)?！保?5）我們不能阻礙技術(shù)的發(fā)展，而應(yīng)該引導(dǎo)技術(shù)發(fā)展。通過(guò)我國(guó)先后頒布的相關(guān)法律法規(guī)可以看出，我國(guó)鼓勵(lì)各類生成式人工智能技術(shù)在各行業(yè)、各領(lǐng)域的創(chuàng)新應(yīng)用，采取“寬進(jìn)寬出”的結(jié)構(gòu)原則。同時(shí)，類似AI 語(yǔ)音包因其獨(dú)特趣味性也大受好評(píng)，大量用戶甚至新聞媒體都在視頻制作中進(jìn)行使用和傳播。在符號(hào)價(jià)值、快樂(lè)原則高度凸顯的當(dāng)今社會(huì)，隨著重視用戶體驗(yàn)和貼近消費(fèi)者個(gè)性化需求的社會(huì)文化生態(tài)逐步形成，具有獨(dú)特個(gè)性和高度便利性的深度語(yǔ)音合成技術(shù)將迅速贏得年輕用戶群體的接受與青睞。因此，既要不斷落實(shí)和規(guī)范保護(hù)作品的版權(quán)，也不能阻礙社會(huì)文化創(chuàng)作的繁榮發(fā)展，要引導(dǎo)深度合成技術(shù)的良性發(fā)展，激發(fā)創(chuàng)作和創(chuàng)新活力，推動(dòng)文化市場(chǎng)發(fā)展。

（作者王歡妮系重慶師范大學(xué)新聞與傳媒學(xué)院教授；鐘艷系重慶師范大學(xué)新聞與傳媒學(xué)院碩士研究生）