洪少華 盧曉華 劉洪靜
摘要:人工智能的發(fā)展推動(dòng)了虛擬數(shù)字人技術(shù)的成熟與落地,國(guó)內(nèi)主流媒體緊跟技術(shù)發(fā)展趨勢(shì),積極探索虛擬數(shù)字人在專業(yè)服務(wù)、偶像娛樂等場(chǎng)景中的應(yīng)用,推出了虛擬記者、虛擬主播、虛擬主持人等一大批“數(shù)字媒體人”。針對(duì)當(dāng)前虛擬數(shù)字人在主流媒體的應(yīng)用痛點(diǎn),可在拓展應(yīng)用場(chǎng)景、突出情感設(shè)計(jì)的同時(shí)加速構(gòu)建虛擬數(shù)字人的商業(yè)運(yùn)作模式和身份認(rèn)證體系,推動(dòng)虛擬數(shù)字人的更新迭代及其在主流媒體的應(yīng)用完善。
關(guān)鍵詞:虛擬數(shù)字人 主流媒體 人工智能
2018年5月2日,以著名主持人康輝為原型的虛擬主持人亮相央視新聞?lì)l道《直播長(zhǎng)江》欄目,標(biāo)志著虛擬數(shù)字人在國(guó)內(nèi)傳媒業(yè),尤其是在主流媒體中的新一輪應(yīng)用熱潮的到來。此后,人民日?qǐng)?bào)、新華社、中央廣播電視總臺(tái)、浙江衛(wèi)視、上海廣播電視臺(tái)等各級(jí)各類主流媒體相繼加入對(duì)虛擬數(shù)字人的應(yīng)用探索,先后推出了數(shù)十位由虛擬數(shù)字人擔(dān)任的記者、主播、主持人、傳媒推廣人。虛擬數(shù)字人的應(yīng)用不僅為媒體深度融合提供了動(dòng)力,也加快了人機(jī)共生時(shí)代來臨的步伐。聚焦虛擬數(shù)字人在主流媒體的最新應(yīng)用動(dòng)態(tài)、省思其現(xiàn)狀與問題對(duì)促進(jìn)主流媒體自我革新、推動(dòng)數(shù)字人技術(shù)發(fā)展進(jìn)步意義重大。
智能化是媒體深度融合的重要趨勢(shì),人工智能為媒體智能化發(fā)展和全媒體傳播體系構(gòu)建提供了技術(shù)支撐,也為虛擬數(shù)字人的技術(shù)研發(fā)、落地實(shí)踐和應(yīng)用創(chuàng)新注入了新的動(dòng)力。虛擬數(shù)字人在包括傳媒行業(yè)在內(nèi)的各個(gè)社會(huì)生產(chǎn)領(lǐng)域迎來了廣闊、蓬勃的發(fā)展前景。
1.“虛擬數(shù)字人”定義。“數(shù)字人”(Digital Human)指的是借助信息科學(xué)方法對(duì)人體進(jìn)行虛擬仿真而得到的多層次數(shù)字模型。數(shù)字人是生命科學(xué)與信息科學(xué)碰撞、交融的產(chǎn)物,能夠從微觀到宏觀,從生理到智能,從分子、細(xì)胞、組織、到器官、整體等不同層級(jí)實(shí)現(xiàn)對(duì)人體的精確模擬。與生命科學(xué)領(lǐng)域稍有差異的是,應(yīng)用于信息傳播領(lǐng)域的數(shù)字人多指的是“虛擬數(shù)字人”(Virtual Human),即具備類人化數(shù)字外形與認(rèn)知能力、在數(shù)字虛擬環(huán)境中行使自動(dòng)化代理功能的交互式虛擬人物。有別于實(shí)體機(jī)器人,虛擬數(shù)字人需要以數(shù)字顯示設(shè)備為存在載體,能夠從外觀、行為、智能等方面模擬人類,比如模擬人類的容貌、性征、語言、表情、動(dòng)作,部分虛擬數(shù)字人可識(shí)別外部環(huán)境并實(shí)現(xiàn)與外界的交流互動(dòng)。虛擬數(shù)字人是通往元宇宙的入口,是人工智能技術(shù)在圖形動(dòng)畫領(lǐng)域的關(guān)鍵性應(yīng)用。融合了多種高新尖智能技術(shù)的虛擬數(shù)字人,在驅(qū)動(dòng)社會(huì)各行業(yè)發(fā)展及拓展人類生存體驗(yàn)的同時(shí),也拉開了全新人機(jī)共生智媒時(shí)代的序幕。
2.人工智能為虛擬數(shù)字人的繁榮和升級(jí)提供技術(shù)動(dòng)力。當(dāng)前,虛擬數(shù)字人仍處于技術(shù)研發(fā)和落地實(shí)踐的初期階段,業(yè)界對(duì)虛擬數(shù)字人的通用系統(tǒng)框架尚未形成統(tǒng)一定論。參考《2020年虛擬數(shù)字人發(fā)展白皮書》,虛擬數(shù)字人通用系統(tǒng)框架可初步劃分為基礎(chǔ)模塊和拓展模塊兩類,前者包含語音生成、動(dòng)畫生成、人物形象和音視頻合成顯示等四大模塊,后者則主要指代交互模塊。語音生成模塊負(fù)責(zé)生成基于文本的人物語音,動(dòng)畫生成模塊負(fù)責(zé)生成與人物語音匹配的人物動(dòng)畫,二者共同服務(wù)于人物表達(dá)。產(chǎn)出的語音和動(dòng)畫再經(jīng)由音視頻合成顯示模塊加工成視頻。人物形象模塊主要負(fù)責(zé)虛擬數(shù)字人的形象設(shè)計(jì),如外形風(fēng)格(超寫實(shí)、寫實(shí)或卡通等)和外觀維度(2D或3D)。交互模塊則決定了虛擬數(shù)字人是否具有基于語音識(shí)別、視覺識(shí)別等智能技術(shù)的交互功能,而按照是否配備交互模塊,虛擬數(shù)字人又可劃分為交互型數(shù)字人和非交互型數(shù)字人。
自2018年起,隨著深度學(xué)習(xí)算法的快速發(fā)展,虛擬數(shù)字人,尤其是智能驅(qū)動(dòng)型數(shù)字人的研發(fā)與應(yīng)用不斷取得突破,更加精細(xì)、更加智能的虛擬數(shù)字人在社會(huì)生產(chǎn)各領(lǐng)域嶄露頭角。人工智能技術(shù)從人物生成、合成顯示、分析決策等方面推動(dòng)虛擬數(shù)字人應(yīng)用所依賴的關(guān)鍵技術(shù)發(fā)展成熟。同時(shí),在制作和應(yīng)用成本大幅下降的同時(shí),虛擬數(shù)字人的交流互動(dòng)能力和虛擬仿真程度卻在不斷提升,其行業(yè)應(yīng)用場(chǎng)景得到極大拓展,不僅傳媒行業(yè)積極展開虛擬數(shù)字人應(yīng)用探索,影視、游戲、文旅、教育等行業(yè)都在積極擁抱數(shù)字人技術(shù)。
早在本世紀(jì)初傳媒行業(yè)便開始了對(duì)虛擬數(shù)字人的應(yīng)用探索。在國(guó)外,2000年英國(guó)PA New Media公司推出了全球首位虛擬主播“安娜諾娃”(Ananova),隨后日本、韓國(guó)也先后出現(xiàn)了虛擬偶像“寺井有紀(jì)”(Yuki)、“露西雅”(Lusia)。在國(guó)內(nèi),2004年中央電視臺(tái)電影頻道上崗了國(guó)內(nèi)第一位傳媒數(shù)字人——以主持人身份亮相《光影周刊》節(jié)目的“小龍”。2018年起,隨著人工智能技術(shù)的成熟,國(guó)內(nèi)新一輪虛擬數(shù)字人應(yīng)用熱潮來臨,主流媒體成為落地虛擬數(shù)字人應(yīng)用實(shí)踐的先鋒力量。
1.廣泛落地?cái)?shù)字人應(yīng)用實(shí)踐,積極推動(dòng)數(shù)字人應(yīng)用創(chuàng)新。在過去五年里,人工智能的發(fā)展為虛擬數(shù)字人的研發(fā)、迭代和落地實(shí)踐提供了強(qiáng)大的技術(shù)支撐。國(guó)內(nèi)主流媒體緊跟技術(shù)發(fā)展趨勢(shì),積極探索虛擬數(shù)字人應(yīng)用,從廣電媒體到報(bào)業(yè)集團(tuán),從中央媒體到地方媒體,各傳媒機(jī)構(gòu)紛紛投入虛擬數(shù)字人應(yīng)用探索,推出虛擬主播、虛擬記者、虛擬編輯、虛擬主持人等“數(shù)字媒體人”。虛擬數(shù)字人在主流媒體中迎來了蓬勃、繁榮的整體發(fā)展態(tài)勢(shì)。目前,國(guó)內(nèi)主流媒體的“數(shù)字員工”已經(jīng)多達(dá)數(shù)十位,其中最為知名的有央視網(wǎng)的數(shù)字小編“小C”、新華社的數(shù)字記者“小錚”、央視新媒體中心的“AI王冠”,以及浙江衛(wèi)視的“谷小雨”、北京電視臺(tái)的“時(shí)間小妮”等。其中,新華社“小錚”采用的是目前全球領(lǐng)先的實(shí)時(shí)高保真數(shù)字人技術(shù)。從高精度的超寫實(shí)數(shù)字人到著名主持人的虛擬分身,越來越多風(fēng)格、氣質(zhì)各異的虛擬數(shù)字媒體人走上崗位,成為業(yè)界認(rèn)可、大眾熟悉的傳媒新生力量。
2.聚力專業(yè)服務(wù)場(chǎng)景,探索多元應(yīng)用途徑。虛擬數(shù)字人主要應(yīng)用于專業(yè)服務(wù)、偶像娛樂、情感陪伴三大場(chǎng)景,具體應(yīng)用形式多樣,包括虛擬主持、虛擬偶像、虛擬導(dǎo)游、虛擬客服、虛擬陪護(hù)等。主流媒體的虛擬數(shù)字人應(yīng)用主要集中在專業(yè)服務(wù)場(chǎng)景,對(duì)偶像娛樂場(chǎng)景的開發(fā)呈現(xiàn)拓展之勢(shì),但受經(jīng)費(fèi)、策劃等原因限制對(duì)情感陪伴場(chǎng)景的涉入較少。
在專業(yè)服務(wù)場(chǎng)景中,主流媒體主要聚焦于虛擬主持的開發(fā)利用,虛擬數(shù)字人的主要工作是資訊播報(bào)和節(jié)目主持。聚力虛擬主持的原因主要有二:一是該類應(yīng)用符合主流媒體內(nèi)容生產(chǎn)的提質(zhì)增效需求。隨著數(shù)字人數(shù)據(jù)采集技術(shù)的進(jìn)步和使用成本的下降,由虛擬數(shù)字人負(fù)責(zé)視聽內(nèi)容播報(bào)的便捷性大幅提升而門檻大幅降低。二是該類應(yīng)用能夠在運(yùn)營(yíng)、客戶服務(wù)、視聽內(nèi)容生產(chǎn)等各方面推動(dòng)主流媒體的創(chuàng)新發(fā)展。以北京廣播電視臺(tái)的智能交互虛擬數(shù)字主持人“時(shí)間小妮”為例,目前“時(shí)間小妮”已經(jīng)從稿件、互動(dòng)、大數(shù)據(jù)等各方面實(shí)現(xiàn)了與客戶端的全面API對(duì)接,具備了在客戶端進(jìn)行客戶服務(wù)、資訊播報(bào)、交互問答的全智能視頻服務(wù)能力,能夠應(yīng)對(duì)不同個(gè)體在不同場(chǎng)景下的用戶需求。
3.業(yè)務(wù)場(chǎng)景引領(lǐng)能力要求,合作研發(fā)推動(dòng)技術(shù)賦能。主流媒體虛擬數(shù)字員工的能力要求主要取決于其應(yīng)用場(chǎng)景:視聽播報(bào)場(chǎng)景中的虛擬主播主要負(fù)責(zé)信息播報(bào),可以實(shí)現(xiàn)多語言播報(bào)、場(chǎng)景切換和一鍵換裝,但大多不具備交互能力。訪問直播場(chǎng)景中的虛擬主持人交互能力相對(duì)更強(qiáng),對(duì)技術(shù)和內(nèi)容安全的要求也更高,工作過程中經(jīng)常需要在人工接管和AI驅(qū)動(dòng)之間切換。虛擬偶像場(chǎng)景中的數(shù)字人需要同時(shí)具備突出的交互能力和動(dòng)作能力,因此現(xiàn)階段仍以人工驅(qū)動(dòng)為主,其動(dòng)作生成主要來自于對(duì)真人肢體動(dòng)作的采集和遷移。
在研發(fā)層面上,主流媒體自主展開虛擬數(shù)字人技術(shù)研究和實(shí)踐應(yīng)用的相對(duì)較少,這主要是因?yàn)樘摂M數(shù)字人的升級(jí)迭代對(duì)人工智能的依賴非常大,與人工智能企業(yè)合作更有利于整合各方資源、加快研究進(jìn)程。在與人工智能企業(yè)的合作分工中,主流媒體負(fù)責(zé)應(yīng)用場(chǎng)景的提供和虛擬數(shù)字人的整體運(yùn)營(yíng),企業(yè)則負(fù)責(zé)提供技術(shù)保障。如新華社的“小錚”、央視網(wǎng)的“小C”便分別是主流媒體與騰訊游戲、百度智能云合作的成果。
從現(xiàn)階段的應(yīng)用實(shí)踐不難看出,當(dāng)前國(guó)內(nèi)主流媒體虛擬數(shù)字人應(yīng)用的核心痛點(diǎn)是應(yīng)用場(chǎng)景過于局限、商業(yè)模式不夠明晰以及受技術(shù)與使用成本的鉗制較大。未來,主流媒體可以從應(yīng)用場(chǎng)景拓展、產(chǎn)品設(shè)計(jì)升維、商業(yè)模式構(gòu)建、認(rèn)證體系完善等方面入手激發(fā)虛擬數(shù)字人的傳播潛能。
1.明晰商業(yè)運(yùn)作模式,強(qiáng)化虛擬數(shù)字人商業(yè)變現(xiàn)能力。商業(yè)運(yùn)作模式不清晰、變現(xiàn)能力不強(qiáng)是主流媒體虛擬數(shù)字人應(yīng)用的重大瓶頸之一。當(dāng)前,虛擬數(shù)字人,尤其是高仿真和人工智能驅(qū)動(dòng)類的數(shù)字人的研發(fā)和體驗(yàn)成本依然高昂,迫切的應(yīng)用需求和巨大的資金壓力讓虛擬數(shù)字人的商業(yè)變現(xiàn)問題愈加凸顯。不同于Noonoouri、Lil Miquela等在抖音、YouTube平臺(tái)上擁有超高人氣,能夠通過打賞、贊助、廣告、訂閱、平臺(tái)分成、電商帶貨等多樣化路徑實(shí)現(xiàn)大規(guī)模變現(xiàn)的虛擬網(wǎng)紅和時(shí)尚博主,虛擬數(shù)字人在主流媒體中的應(yīng)用主要集中于生產(chǎn)端提效,其營(yíng)收的核心途徑是規(guī)模非常有限的新媒體廣告。為了保證虛擬數(shù)字人的研發(fā)、應(yīng)用品質(zhì)和可持續(xù)運(yùn)營(yíng),主流媒體要有意識(shí)地增強(qiáng)虛擬數(shù)字人的“造血”能力。可參照虛擬偶像的運(yùn)作模式,加強(qiáng)跨界運(yùn)營(yíng)、突破資源合作壁壘,積極探索數(shù)字藏品、非同質(zhì)化代幣等新型商業(yè)模式,加大虛擬數(shù)字人的知識(shí)產(chǎn)權(quán)開發(fā)力度,不斷拓展數(shù)字人的應(yīng)用場(chǎng)景和變現(xiàn)途徑。
2.緊扣數(shù)字人本質(zhì),深挖虛擬數(shù)字人應(yīng)用價(jià)值。從媒介傳播的視角來看,虛擬數(shù)字人的本質(zhì)是一種由新興數(shù)字技術(shù)所創(chuàng)造的新型軀體,對(duì)虛擬數(shù)字人的應(yīng)用是一種智能身體傳播實(shí)踐。這種傳播范式有效整合了被傳統(tǒng)大眾傳媒無意中割裂的各類人體感官,并通過對(duì)多重時(shí)間和復(fù)合空間的彌合進(jìn)一步豐富了人類生存狀態(tài)。相較于傳統(tǒng)媒介,融媒體內(nèi)容生產(chǎn)的核心優(yōu)勢(shì)在于它高效促成了人類感官的再造與重組。從這個(gè)意義上看,能夠以數(shù)字化方式生動(dòng)復(fù)刻人類外觀、行動(dòng)、情感和智力的虛擬數(shù)字人可謂是融媒體內(nèi)容生產(chǎn)、創(chuàng)新的新高峰。隨著技術(shù),尤其是強(qiáng)人工智能的成熟,虛擬數(shù)字人極有可能由智能身體傳播的中介升格為傳播主體,深化主流媒體的“多域整合”進(jìn)程,助力主流媒體創(chuàng)新內(nèi)容生產(chǎn),甚至扭轉(zhuǎn)主流媒體在當(dāng)前信息傳播格局中的不利位置,為主流媒體探索元宇宙多維信息傳播模式、參與構(gòu)建跨維度信息傳播格局提供強(qiáng)勁動(dòng)力。
虛擬數(shù)字人的應(yīng)用價(jià)值來自于對(duì)人的價(jià)值的模擬仿真,而隨著人工智能技術(shù)的發(fā)展和數(shù)字人情感化設(shè)計(jì)的持續(xù)升溫,虛擬數(shù)字人的傳播價(jià)值和媒體應(yīng)用場(chǎng)景將大幅拓展。當(dāng)前主流媒體能夠?yàn)樘摂M數(shù)字人提供的工作場(chǎng)景較為有限,主要集中在新聞播報(bào)方面。這主要是因?yàn)樘摂M主播、虛擬主持人的應(yīng)用成本和技術(shù)要求相對(duì)較低,需要的運(yùn)營(yíng)支撐相對(duì)輕量。此外,在現(xiàn)有的應(yīng)用場(chǎng)景中,虛擬數(shù)字人的本質(zhì)是工具,其價(jià)值尚未超越場(chǎng)景中信息的價(jià)值。未來,虛擬數(shù)字人作為信息的價(jià)值、作為服務(wù)的作用會(huì)隨著智能技術(shù)的發(fā)展進(jìn)一步凸顯,更多數(shù)字人將成為涉足“表演人”場(chǎng)景、“專業(yè)人”場(chǎng)景,在社交、表演、教育、資訊等活動(dòng)中擔(dān)當(dāng)主角。
3.提升情感設(shè)計(jì)層次,突破數(shù)字人“工具”價(jià)值定位。美國(guó)認(rèn)知心理學(xué)家唐納德·諾曼認(rèn)為,情感在產(chǎn)品設(shè)計(jì)、傳播中扮演著極為重要的角色,他的《情感化設(shè)計(jì)》將產(chǎn)品的情感設(shè)計(jì)劃分為三個(gè)層次:一是本能層,即產(chǎn)品給使用者帶來的先于思考和邏輯的直觀印象;二是行為層,即產(chǎn)品與用戶的理性交互關(guān)系;三是反思層,即產(chǎn)品能夠激發(fā)使用者獨(dú)特記憶、情感共鳴并使其忠于產(chǎn)品的品牌差異性。
虛擬數(shù)字人要實(shí)現(xiàn)價(jià)值超越就必須具有交互和共情的能力,因此必須借助情感化設(shè)計(jì)來滿足受眾在本能層、行為層和反思層的使用訴求。在本能層,可以通過優(yōu)化虛擬數(shù)字人的外觀、衣著和氣質(zhì)強(qiáng)化其視覺吸引力,為受眾帶來更好的視覺體驗(yàn)和審美享受。在行為層,要強(qiáng)化語音合成、自然語言理解等技術(shù)的應(yīng)用與升級(jí),提升虛擬數(shù)字人的人機(jī)交互能力,做到“能聽、能說、能理解”。在反思層,要重點(diǎn)提升虛擬數(shù)字人的共情能力,一方面要借助人工智能強(qiáng)大虛擬數(shù)字人的情感計(jì)算中樞,幫助其識(shí)別、理解人類情感,提升交互的準(zhǔn)確性;另一方面要做好虛擬數(shù)字人的持續(xù)運(yùn)營(yíng),通過人設(shè)塑造、跨界合作等方式強(qiáng)化其個(gè)性與才能,幫助虛擬數(shù)字人贏得大眾的信任與認(rèn)可。
4.完善數(shù)字人身份認(rèn)證體系,警惕技術(shù)濫用風(fēng)險(xiǎn)。在積極探索虛擬數(shù)字人技術(shù)與應(yīng)用的同時(shí),主流媒體還需要對(duì)高新技術(shù)應(yīng)用可能帶來的負(fù)面社會(huì)影響和內(nèi)容安全隱患保持警惕。技術(shù)是一把雙刃劍,能夠創(chuàng)造出仿真主播的數(shù)字人技術(shù)同樣可以被用于偽造包括政要、名人在內(nèi)的一切真實(shí)人類。對(duì)虛擬數(shù)字人的濫用,不論是政治抹黑、恐怖行動(dòng),還是色情暴力、經(jīng)濟(jì)詐騙,抑或者詆毀誹謗、虛假信息傳播等,都可能給社會(huì)造成不利影響甚至巨大災(zāi)難。具體到傳媒領(lǐng)域,考慮到媒體機(jī)構(gòu)不同于個(gè)人的巨大社會(huì)影響力,一旦媒體數(shù)字人應(yīng)用失范,將極大可能引起媒體社會(huì)信任破壞、新聞客觀性消解等重大問題。對(duì)此,主流媒體必須在虛擬數(shù)字人的應(yīng)用中始終保持人文反思與技術(shù)警惕,大力發(fā)展溯源追蹤和內(nèi)容鑒別技術(shù),逐步建立健全數(shù)字人身份認(rèn)證體系,保證虛擬數(shù)字人應(yīng)用的正當(dāng)性和內(nèi)容生產(chǎn)的安全性。
作者洪少華系新疆大學(xué)新聞與傳播學(xué)院副教授
盧曉華系新疆大學(xué)新聞與傳播學(xué)院副教授
劉洪靜系新疆大學(xué)新聞與傳播學(xué)院研究生
參考文獻(xiàn)
[1]孫柏林.虛擬化背景下的“數(shù)字人”[J].計(jì)算機(jī)仿真,2023(01).
[2]王瑩,梁雪媛.虛擬主體性與虛擬物質(zhì)性:論數(shù)字人形象[J].福建師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2022(05).
[3]郭全中.虛擬數(shù)字人發(fā)展的現(xiàn)狀、關(guān)鍵與未來[J].新聞與寫作,2022(07).
[4]譚春林.虛擬數(shù)字人用于學(xué)術(shù)期刊視頻融合出版實(shí)踐[J].編輯學(xué)報(bào),2023(01).
[5]侯文軍,卜瑤華,劉聰林.虛擬數(shù)字人:元宇宙人際交互的技術(shù)性介質(zhì)[J].傳媒,2023(04).
[6]朱永瓊,宋章通,方浩.“文旅元宇宙”中虛擬數(shù)字人的應(yīng)用[J].傳媒,2023(03).
【編輯:朱垚穎】