張 文
(蘭州現(xiàn)代職業(yè)學院,甘肅 蘭州 730020)
虛擬數(shù)字人技術(shù)的崛起正在改變新聞行業(yè)的面貌。本文旨在深入探討虛擬數(shù)字人技術(shù)的概念、關(guān)鍵技術(shù)組成、發(fā)展現(xiàn)狀以及多個應用領(lǐng)域,特別關(guān)注其在新聞領(lǐng)域的應用,揭示虛擬數(shù)字人技術(shù)如何重塑新聞生產(chǎn)方式,影響新聞質(zhì)量和傳播效果,并探討其對未來新聞業(yè)的深遠影響。
虛擬數(shù)字人是指存在于非物理世界中,由計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成等計算機手段創(chuàng)造及使用,具有多重人類特征的綜合產(chǎn)物[1]。這些虛擬數(shù)字人不僅能夠模擬人類的外貌和語音,還具備自主決策、自然語言理解和情感表達的能力。虛擬數(shù)字人應用范圍廣泛,包括虛擬偶像、虛擬主播、虛擬助手、游戲角色及在線教育導師等,具有擬人化、互動性、智能化3 個特點。
虛擬數(shù)字人包括多種關(guān)鍵技術(shù)。這些技術(shù)協(xié)同工作,創(chuàng)造逼真的虛擬個體。計算機圖形學技術(shù)用來創(chuàng)建虛擬數(shù)字人的外貌和環(huán)境,包括建模人物的三維外觀、紋理映射、骨骼動畫等,確保虛擬數(shù)字人的外觀和動作逼真。圖形渲染技術(shù)用于將虛擬場景呈現(xiàn)在屏幕上,制造光照、陰影、反射和抗鋸齒等效果,以提高視覺真實感。動作捕捉技術(shù)用來捕捉現(xiàn)實世界中的運動和動作,并將其應用于虛擬數(shù)字人,有助于實現(xiàn)自然的動作和表情。深度學習算法用于面部表情生成、姿勢識別和語義理解等方面。深度學習模型從大量數(shù)據(jù)中進行學習,提高虛擬數(shù)字人的智能水平。語音合成技術(shù)用于創(chuàng)建虛擬數(shù)字人的聲音,生成自然流暢的語音,使虛擬數(shù)字人能夠與用戶進行實時語音互動[2]。
艾媒咨詢調(diào)查報告顯示,2022 年,我國虛擬人帶動產(chǎn)業(yè)市場規(guī)模和核心市場規(guī)模分別為1 866.1 億元和120.8 億元,預計2025 年將分別達到6 402.7 億元和480.6 億元,呈現(xiàn)強勁增長態(tài)勢[3]。
虛擬數(shù)字人產(chǎn)業(yè)的發(fā)展離不開企業(yè)的支持。早期企業(yè)包括科大訊飛、騰訊、阿里、百度等企業(yè),此類互聯(lián)網(wǎng)早期企業(yè)技術(shù)力量扎實,較早布局虛擬數(shù)字人產(chǎn)業(yè)。此后,商湯智能科技、火山引擎、中科深智、小冰等企業(yè)紛紛入局虛擬數(shù)字人產(chǎn)業(yè)[4]。如2018 年騰訊旗下的NExT Studios 發(fā)布Siren 虛擬數(shù)字人,2021 年發(fā)布全球首位數(shù)字航天員小諍。又如,2021 年,百度發(fā)布數(shù)字人直播平臺“曦靈”,提供虛擬主持人、虛擬員工、虛擬偶像及品牌代言人等虛擬數(shù)字人創(chuàng)建與運營服務。字節(jié)跳動旗下北京火山引擎推出虛擬數(shù)字人應用平臺,為各行業(yè)提供客服、智慧導覽、智能助理、虛擬直播等場景的虛擬數(shù)字人應用解決方案。2022 年8 月,芒果TV 創(chuàng)新研究院與騰訊云聯(lián)合發(fā)布虛擬人直播互動平臺,為企業(yè)提供輕量化、異地化、專業(yè)化的虛擬內(nèi)容生產(chǎn)服務[5]。
虛擬數(shù)字人技術(shù)在各個領(lǐng)域都有廣泛的應用。第一,娛樂領(lǐng)域。虛擬數(shù)字人技術(shù)在電子游戲、虛擬現(xiàn)實、增強現(xiàn)實等娛樂領(lǐng)域得到廣泛應用,創(chuàng)建逼真的游戲角色,增強游戲體驗,并為虛擬世界賦予生命。第二,教育領(lǐng)域。教育界利用虛擬數(shù)字人來提供個性化的在線教育體驗。虛擬教育導師與學生互動,解答問題,甚至提供情感支持,提高教育質(zhì)量。第三,新聞領(lǐng)域。在新聞領(lǐng)域,虛擬數(shù)字人用于新聞報道、播報和主持,提供即時新聞更新,解釋復雜的話題,增強新聞體驗,甚至在危機時刻提供信息。第四,客戶服務。虛擬數(shù)字人在客戶服務中充當虛擬助手,可以回答常見問題,提供產(chǎn)品信息,提高客戶滿意度,并減輕人工客服的壓力。第五,藝術(shù)和文化。虛擬數(shù)字人技術(shù)為藝術(shù)家和文化創(chuàng)意工作者提供了無限可能性,可用于創(chuàng)作虛擬角色、數(shù)字藝術(shù)和互動演出。
將虛擬數(shù)字人應用在新聞采訪中,是新聞領(lǐng)域的一項創(chuàng)新。虛擬數(shù)字人可以充當新聞采訪者的角色。比如虛擬記者,能夠提出問題、追問信息,甚至模擬各種采訪風格和語氣,與被采訪者進行互動。新聞采訪中的虛擬數(shù)字人角色一般具有以下功能。
(1)實時信息獲取。虛擬數(shù)字人可以接入實時新聞源和數(shù)據(jù)庫,迅速獲取和整理大量信息,以支持采訪過程。這有助于提供準確和及時的新聞報道。
(2)語言翻譯。虛擬數(shù)字人能夠在多語言采訪中發(fā)揮關(guān)鍵作用,可快速翻譯和轉(zhuǎn)述采訪對象的話語,使跨文化和多語言報道更容易實現(xiàn)。
(3)自然語言理解。虛擬數(shù)字人能夠理解和分析采訪對象的回答,從中提取重要信息,有助于報道的深度分析。
(4)互動性。虛擬數(shù)字人具有互動性,允許觀眾通過虛擬平臺參與采訪,提出問題,與虛擬采訪者互動,從而增強新聞體驗。
以百度虛擬數(shù)字人度曉曉為例,其在新聞采訪過程中發(fā)揮著關(guān)鍵作用。度曉曉基于百度大腦7.0核心技術(shù)驅(qū)動,整合了多模態(tài)交互技術(shù)、3D 數(shù)字人建模、機器翻譯、語音識別、自然語言理解等多項技術(shù),展現(xiàn)出強大的人工智能(Artificial Intelligence,AI)交互能力及生成式人工智能(Artificial Intelligence Generated Content,AIGC)能力,為用戶提供更加親切、更具科技感、沉浸感的體驗。2022年5 月,虛擬數(shù)字人度曉曉擔任工人日報特派“AI記者”,參加全國五一勞動獎獲得者新聞采訪活動。度曉曉還以“AI 記者”身份參與了首屆大國工匠創(chuàng)新交流大會新聞采訪活動。大會以線上3D VR展廳、全景“云巡館”、直播“云觀展”等多種形式呈現(xiàn),“AI 記者”度曉曉帶領(lǐng)觀眾云端游覽展會,向觀眾解讀我國工業(yè)與制造業(yè)發(fā)展成果[6]。
虛擬數(shù)字人在新聞編輯中的應用,給新聞產(chǎn)業(yè)帶來了革命性的改變,主要表現(xiàn)在以下方面。
(1)自動化新聞生成。虛擬數(shù)字人自動分析數(shù)據(jù)、事件和信息源,然后生成新聞文章,能夠迅速提供大量的新聞內(nèi)容,節(jié)省新聞編輯的時間和勞動力。
(2)新聞稿件的多語言轉(zhuǎn)化。虛擬數(shù)字人技術(shù)能夠?qū)⑿侣劯寮焖俜g成多種語言,擴大了新聞報道的受眾范圍。
(3)自然語言處理。虛擬數(shù)字人在新聞編輯中具備自然語言處理能力,幫助編輯分析和提取新聞材料中的關(guān)鍵信息,輔助編寫和編輯過程。
(4)內(nèi)容個性化。虛擬數(shù)字人能夠根據(jù)用戶的興趣和偏好,自動生成個性化的新聞內(nèi)容,提高用戶體驗和新聞觀眾的忠誠度。
(5)數(shù)據(jù)可視化。虛擬數(shù)字人將數(shù)據(jù)轉(zhuǎn)化為可視化圖表和圖形,使復雜的數(shù)據(jù)更容易理解,豐富了新聞報道的形式。
(6)人機協(xié)作。虛擬數(shù)字人與人類編輯協(xié)同工作,提供新聞稿件的初稿,由編輯進行進一步的審查和修改。
以天津津云新媒體集團股份有限公司的虛擬數(shù)字人2.0 內(nèi)容生產(chǎn)系統(tǒng)為例,其在新聞編輯中發(fā)揮了關(guān)鍵性作用,主要用于生成高質(zhì)量的虛擬數(shù)字人視頻內(nèi)容。該系統(tǒng)采用AI 技術(shù)和3D 建模技術(shù),快速、準確地生成虛擬數(shù)字人視音頻內(nèi)容,大大提高了新聞內(nèi)容的生產(chǎn)效率和質(zhì)量?;谏疃葘W習的面部捕捉和身體姿態(tài)捕捉系統(tǒng),實時捕捉演員的表情和動作,并將其轉(zhuǎn)化為虛擬數(shù)字人的表情和動作,擁有強大的語音合成和語音識別功能,實現(xiàn)語音交互和自動字幕生成等功能。以北京美攝網(wǎng)絡科技有限公司的AIGC+Avata 數(shù)字人解決方案為例,使用先進的計算機視覺和人工智能技術(shù),實現(xiàn)更加逼真、交互性更強的AIGC 內(nèi)容生產(chǎn)創(chuàng)作新體驗。對新聞編輯工作而言,使用AIGC+Avata 數(shù)字人解決方案,能夠?qū)崿F(xiàn)新聞內(nèi)容的自動生成,包括文字、圖片、音頻、視頻形式。
虛擬數(shù)字人在新聞播報和主持中的應用是新聞行業(yè)的一項創(chuàng)新,擔任主持人和播音員的角色,具有以下關(guān)鍵功能和應用。第一,新聞播報。虛擬數(shù)字人用逼真的外貌和語音合成技術(shù)來播報新聞,使得新聞機構(gòu)能夠?qū)崿F(xiàn)7×24 h 的新聞播報,減少對人力資源的依賴,并確保新聞不受時間限制。第二,多語言播報。虛擬數(shù)字人技術(shù)使得播音員輕松切換多種語言,滿足不同觀眾的需求,擴大了新聞報道的受眾范圍。第三,即時新聞更新。虛擬數(shù)字人可以迅速更新新聞,特別是在緊急情況下,以提供即時的新聞報道,有助于觀眾獲得最新的信息。第四,節(jié)目主持。虛擬數(shù)字人用于主持新聞節(jié)目,引導討論、采訪嘉賓,甚至提供評論和分析。第六,可定制性。虛擬數(shù)字人可根據(jù)需要進行定制,包括外貌、聲音、語言、風格和主題,以滿足不同的新聞節(jié)目需求。
以2020 年上海廣播電視臺虛擬新聞主播申?雅為例,其是虛擬數(shù)字人在新聞播報和主持領(lǐng)域的典型應用,通過4D 掃描、智能綁定、實時渲染引擎,不斷提升角色表現(xiàn)力,應用動作捕捉采集技術(shù)、影視級面捕技術(shù)、計算機動畫(Computer Graphics,CG)技術(shù)合成等全新的技術(shù)流程,使得虛擬數(shù)字人從表情到動作更加生動自然。在新聞播報中,申?雅可以自動生成新聞報道,語言流暢自然,與真實人類主播無異。她能夠準確地播報新聞,包括國內(nèi)外的政治、經(jīng)濟、文化、體育等各個領(lǐng)域的新聞。申?雅通過模擬人類情感和語氣,使得新聞播報更加生動、有趣。申?雅多次參與重大新聞播報,如“迎接黨的二十大”主題宣傳報道、第五屆進博會全媒體直播特別報道、“慶祝香港回歸祖國25 周年”全媒體特別報道、2022 全國兩會系列報道、2022 世界人工智能大會、2022 北京冬奧會等。此外,還有虛擬主持人言東方、新華社的新小浩和新小萌、虛擬主持人小冰、3D 超寫實虛擬數(shù)字人小C 等虛擬數(shù)字人被廣泛應用于新聞播報,為新聞媒體的發(fā)展提供了新的可能性。
本文深入研究了虛擬數(shù)字人技術(shù)在新聞采編播中的創(chuàng)新應用,重點關(guān)注虛擬數(shù)字人在新聞采訪、編輯和播報中的角色、功能和效益。虛擬數(shù)字人已經(jīng)成為新聞領(lǐng)域的重要工具,提高了新聞生產(chǎn)效率,拓展了報道的多樣性。