明確AI歌手翻唱類音視頻的法律邊界,對(duì)于尊重和保護(hù)相關(guān)權(quán)利人權(quán)益、推動(dòng)音樂(lè)產(chǎn)業(yè)的繁榮和發(fā)展、滿足消費(fèi)者的多重需求等具有重要意義。
隨著人工智能技術(shù)的快速發(fā)展,人工智能生成內(nèi)容已逐漸成為數(shù)字時(shí)代內(nèi)容生產(chǎn)的一種重要模式。AI歌手翻唱行為所形成的音視頻作為一種新興的文化現(xiàn)象,一方面為音樂(lè)愛(ài)好者提供了更加豐富多樣的聽(tīng)覺(jué)體驗(yàn),推動(dòng)了音樂(lè)文化的創(chuàng)新與傳播;另一方面也引發(fā)了人們對(duì)AI歌手翻唱行為可能帶來(lái)的法律糾紛的擔(dān)憂,因而須確定AI歌手翻唱行為的法律邊界。
AI歌手翻唱類音視頻是生成式人工智能在音樂(lè)領(lǐng)域的拓展應(yīng)用,通過(guò)利用AI技術(shù)模仿某目標(biāo)歌手的聲音,對(duì)已有音樂(lè)作品進(jìn)行重新演繹,從而生成具有目標(biāo)歌手音色的新音頻或?qū)⒋艘纛l與相應(yīng)背景畫(huà)面等結(jié)合而成的新視頻。
“翻唱”一詞是一種擬人化表達(dá),其實(shí)際是一個(gè)復(fù)雜的技術(shù)流程,包括聲音樣本的訓(xùn)練、音頻合成以及聲線的精確替換等。目前,實(shí)現(xiàn)這一技術(shù)的軟件有很多,其中,Sovits(Single-shot Voice Identity Swapping Technique)是一種用于音色轉(zhuǎn)換的最為常用的軟件。該軟件的基本原理是通過(guò)數(shù)據(jù)收集、數(shù)據(jù)訓(xùn)練、數(shù)據(jù)推理三個(gè)環(huán)節(jié)提取原始音頻的中間特征,然后再合成目標(biāo)音頻。以AI歌手翻唱A作品為例,在數(shù)據(jù)收集環(huán)節(jié),先收集該歌手曾演唱的歌曲中帶伴奏的音頻,分離伴奏和人聲,提取人聲并將其切割成短的音頻;在數(shù)據(jù)訓(xùn)練環(huán)節(jié),將上一步中切割好的音頻素材拖入整合包中的數(shù)據(jù)文件夾開(kāi)始訓(xùn)練;在模型推理環(huán)節(jié),分離提前收集好的A作品的伴奏和原唱人聲,把人聲拖入“單個(gè)音頻上傳”后進(jìn)行音頻轉(zhuǎn)換,將訓(xùn)練后的AI歌手音色的音軌替換原唱的人聲音軌。最后,在完成上述步驟后,打開(kāi)一款可以進(jìn)行音頻編輯的軟件,將A作品的伴奏與上一步已替換好的音頻進(jìn)行合并,便可得到一首由AI歌手“演唱”的作品。AI歌手翻唱類音視頻的制作并不復(fù)雜,技術(shù)門(mén)檻較低,這為普通用戶學(xué)習(xí)制作AI歌手翻唱類音視頻提供了可能性。此外,一些用戶利用開(kāi)源社區(qū)的現(xiàn)有聲庫(kù),根據(jù)成熟的算法程序進(jìn)行“填空式”操作,便可輕松地將不同的聲音與任意歌曲進(jìn)行搭配組合。這更進(jìn)一步降低了AI歌手翻唱類音視頻的制作難度,使得非專業(yè)人士也能迅速上手并實(shí)現(xiàn)個(gè)性化內(nèi)容的產(chǎn)出,促進(jìn)了此類音視頻的傳播和流行。
國(guó)家互聯(lián)網(wǎng)信息辦公室在2023年8月15日生效的《生成式人工智能服務(wù)管理辦法》第四條和第七條明確規(guī)定:提供生成式人工智能產(chǎn)品或服務(wù)應(yīng)當(dāng)尊重知識(shí)產(chǎn)權(quán),用于生成式人工智能產(chǎn)品的預(yù)訓(xùn)練、優(yōu)化訓(xùn)練數(shù)據(jù)不得侵害他人依法享有的知識(shí)產(chǎn)權(quán)。這些規(guī)定為AI歌手翻唱類音視頻的制作與傳播設(shè)定了明確的法律邊界。
首先,AI歌手翻唱的制作過(guò)程需要對(duì)已有音樂(lè)素材加以利用,包括音頻聲音的收集分流、利用聲音的機(jī)器訓(xùn)練以及合成音頻中其他素材的加工利用。AI歌手翻唱制作對(duì)音樂(lè)素材的使用,通常是將音樂(lè)錄音制品、一般語(yǔ)音文件等上傳至AI模型的服務(wù)器,這一行為若未經(jīng)著作權(quán)人許可,便以無(wú)線方式向公眾開(kāi)放訪問(wèn),使得公眾能夠按照個(gè)人意愿在任何時(shí)間和地點(diǎn)獲取這些作品,特別是當(dāng)部分用戶利用現(xiàn)成的聲庫(kù)和程序來(lái)生成音視頻內(nèi)容時(shí),便極有可能侵犯著作權(quán)人的信息網(wǎng)絡(luò)傳播權(quán)。
其次,歌手的音樂(lè)表演是由歌手通過(guò)自身音色,基于氣口、咬字和斷句等方式對(duì)樂(lè)曲的細(xì)化處理以及歌手個(gè)人對(duì)歌曲獨(dú)特的情感表達(dá)共同構(gòu)成的。真人翻唱也是如此,真人翻唱者的音色、唱腔、咬字、情感表達(dá)等會(huì)完全替換掉原唱者的,形成獨(dú)屬于翻唱者的具有獨(dú)創(chuàng)性的表達(dá)。但AI歌手翻唱?jiǎng)t不同,AI歌手翻唱僅僅只是替換了原歌手的音色卻仍保留原唱者在演唱時(shí)的細(xì)化處理,原歌手因被保留了其演唱技巧仍然享有表演者權(quán)。因此,AI歌手翻唱類音視頻若未標(biāo)明原表演者,可能侵害原表演者表明身份的權(quán)利。
再次,AI歌手翻唱類音視頻在合成最終音頻時(shí)采用了原歌曲的伴奏,這涉及被覆蓋的原歌曲錄制者的著作權(quán),其一般為大型唱片公司和從事錄音業(yè)務(wù)的小型文化傳播公司。根據(jù)《著作權(quán)法》第四十四條規(guī)定,錄音錄像制作者對(duì)其制作的錄音錄像制品,享有許可他人復(fù)制、發(fā)行、出租、通過(guò)信息網(wǎng)絡(luò)向公眾傳播并獲得報(bào)酬的權(quán)利,因而AI歌手翻唱制作階段還可能涉及侵犯錄音錄像制作者的權(quán)利。
AI歌手翻唱行為在傳播階段主要體現(xiàn)為AI歌手翻唱的音視頻被觀眾瀏覽。在其廣泛傳播的過(guò)程中,AI歌手翻唱行為主要涉及對(duì)同行商業(yè)競(jìng)爭(zhēng)利益的侵害和對(duì)真人演唱者人格權(quán)的侵害。
首先,AI歌手翻唱類音視頻的高流量往往是建立在被采樣音色的歌手本人的高知名度的基礎(chǔ)上。被采樣的高知名度歌手是吸引聽(tīng)眾點(diǎn)開(kāi)音頻、下載音頻的直接原因,其為AI歌手翻唱類音視頻創(chuàng)造了巨大的流量和經(jīng)濟(jì)利益。因此,當(dāng)AI技術(shù)生成的音色模型高度逼近原歌手本人的聲音,并用于替換人聲制作音視頻時(shí),這些作品便與原歌手本人產(chǎn)生了緊密關(guān)聯(lián)。若制作者出于營(yíng)利目的,在傳播過(guò)程中未明確標(biāo)注“AI生成”字樣,就極易造成聽(tīng)眾或觀眾的誤解和混淆,還可能因觸犯反不正當(dāng)競(jìng)爭(zhēng)法的相關(guān)規(guī)定而構(gòu)成侵權(quán)。
其次,聲音作為識(shí)別個(gè)人身份的重要依據(jù),具有人身屬性,因而聲音權(quán)益被納入民法典的人格權(quán)保護(hù)范圍。聲音權(quán)的主要權(quán)能包括自我使用權(quán)和許可他人使用權(quán)。自我使用權(quán)是指聲音權(quán)人可以依據(jù)自己的意圖,通過(guò)藝術(shù)加工等形式來(lái)制作自己的聲音,可以自我欣賞自己的錄音作品,也可以利用自己的聲音去獲得收益。許可他人使用權(quán)是指自然人可以將其聲音授予他人使用,并以此獲利。但作為基本權(quán)利,聲音權(quán)無(wú)論是否出于營(yíng)利的目的,未經(jīng)他人同意而使用他人的聲音,都屬于侵害他人的聲音權(quán)。在殷某某訴北京某智能科技公司的全國(guó)首例AI生成聲音侵權(quán)案中,法院認(rèn)為:聲音作為一種人格權(quán)益,具有人身專屬性,對(duì)錄音制品的授權(quán)并不意味著對(duì)聲音AI化的授權(quán),未經(jīng)權(quán)利人許可,擅自使用或許可他人使用錄音制品中的聲音構(gòu)成人格權(quán)侵權(quán)。AI歌手翻唱類音視頻提取原歌手的原始聲音,然后將這些素材作為目標(biāo)音色輸入模型中進(jìn)行訓(xùn)練,生成其音色模型,而后用這個(gè)模型替換其他任意音色,這涉及對(duì)原歌手聲音的使用,因此會(huì)涉及聲音權(quán)益方面的侵權(quán)。
最后,在某些AI歌手翻唱類視頻中,通常還配以原歌手的肖像進(jìn)行背景畫(huà)面的展示。根據(jù)《中華人民共和國(guó)民法典》第一千零一十九條的規(guī)定,未經(jīng)肖像權(quán)人同意,不得以發(fā)表、復(fù)制、發(fā)行、出租、展覽等方式使用或者公開(kāi)肖像權(quán)人的肖像。AI歌手在未經(jīng)原歌手許可的情況下,擅自使用原歌手的肖像作為音視頻的背景畫(huà)面,會(huì)侵犯原歌手的肖像權(quán)。
在數(shù)字時(shí)代,人工智能技術(shù)發(fā)展日新月異。AI歌手翻唱類音視頻作為一種音樂(lè)創(chuàng)新模式,具有加持?jǐn)?shù)字身份使已故歌手得以數(shù)字永生,便利用戶參與音樂(lè)創(chuàng)作等多重價(jià)值。然而,這一創(chuàng)新模式也伴隨著一系列復(fù)雜的法律風(fēng)險(xiǎn),不僅涉及著作權(quán)等知識(shí)產(chǎn)權(quán)的侵權(quán)風(fēng)險(xiǎn),還涉及侵犯姓名權(quán)、聲音權(quán)、肖像權(quán)等人格權(quán)的風(fēng)險(xiǎn)。因此,明確AI歌手翻唱類音視頻的法律邊界,對(duì)于尊重和保護(hù)相關(guān)權(quán)利人權(quán)益、推動(dòng)音樂(lè)產(chǎn)業(yè)的繁榮和發(fā)展、滿足消費(fèi)者的多重需求等具有重要意義。
(作者邱潤(rùn)根系南昌大學(xué)法學(xué)院教授、博士生導(dǎo)師,本文為國(guó)家社科基金項(xiàng)目“個(gè)人信息的數(shù)據(jù)化商業(yè)利用權(quán)益沖突問(wèn)題研究”〔22BFX083〕階段性成果)
編輯:黃靈" " yeshzhwu@foxmail.com