段華 陶玉潔 秦暢
摘要:人工智能技術(shù)的支撐,打開了媒體行業(yè)發(fā)展新格局。當(dāng)前,這一發(fā)展成果被應(yīng)用到傳播領(lǐng)域,人工智能主播出現(xiàn)在大眾視野。文章通過分析人工智能主播建設(shè)的戰(zhàn)略格局及其所呈現(xiàn)出來的功能局限,評估其未來發(fā)展的可行性,旨在拓展人工智能主播研究新視角、延伸人工智能主播應(yīng)用新思路,進(jìn)而推動傳媒產(chǎn)業(yè)、人工智能主播產(chǎn)業(yè)的發(fā)展。文章結(jié)合北京人民廣播電臺真人數(shù)字人“時間小妮”、湖南衛(wèi)視數(shù)字主持人“小漾”以及新華社數(shù)字記者、全球首位數(shù)字航天員“小諍”的應(yīng)用情況,借鑒和參考中國播音學(xué)、傳播學(xué)、計算機(jī)科學(xué)以及人工智能等相關(guān)學(xué)科的知識,針對人工智能主播在廣播領(lǐng)域的發(fā)展現(xiàn)狀,探析如何挖掘人工智能主播的潛力與價值,得出人工智能主播雖然在信息傳遞、娛樂和其他領(lǐng)域中發(fā)揮著重要作用,但在語音合成、情感模擬、信息質(zhì)量和人際互動等方面存在一系列功能局限的結(jié)論。文章指出,受眾對人工智能主播的接受度與其功能水平密切相關(guān),需要更多的技術(shù)創(chuàng)新和用戶體驗優(yōu)化來推動其進(jìn)一步發(fā)展。未來,人工智能主播將凸顯其在信息傳播和用戶互動方面的潛在價值,朝著定制化、情感化、智慧化的方向發(fā)展,通過人工智能技術(shù)為受眾精準(zhǔn)畫像并進(jìn)行個性化分析,推送個性化內(nèi)容,提高受眾的依賴度。
關(guān)鍵詞:人工智能主播;應(yīng)用現(xiàn)狀;功能局限;發(fā)展路徑;未來方向
中圖分類號:G222.2;TP18 文獻(xiàn)標(biāo)志碼:A 文章編號:1674-8883(2024)03-0005-03
課題項目:本論文為2022年度廣東省本科高校在線開放課程指導(dǎo)委員會研究課題“關(guān)于在線開放課程驅(qū)動高校混合教學(xué)變革研究——以普通話語音課程為例”成果,項目編號:2022ZXKC267
目前,我國的人工智能主播建設(shè)普遍呈現(xiàn)以“主流媒體引導(dǎo)、互聯(lián)網(wǎng)公司技術(shù)支持”為特點的戰(zhàn)略格局。在實際應(yīng)用方面,人工智能主播的進(jìn)化發(fā)展呈現(xiàn)出從聲音文本到智能語音對話的轉(zhuǎn)化[1],再到多模態(tài)交互的“三步走”戰(zhàn)略,研究進(jìn)度走在世界前列。
在2018年第五屆世界互聯(lián)網(wǎng)大會上,新華社聯(lián)合搜狗公司推出世界首個全仿真智能主持人“新小浩”。該智能主播以主持人邱浩為原型,可以根據(jù)實際需要選擇漢語或英語播報,實現(xiàn)了“聲音的文本轉(zhuǎn)化”初步設(shè)想[2]。但由于當(dāng)時技術(shù)有限,所以首個全仿真智能主持人只能“坐播”,無法添加相關(guān)聯(lián)的肢體動作[3]。
2019年,新華社與搜狗公司聯(lián)合發(fā)布全新升級的站立式、女性人工智能主播“新小萌”,并投入當(dāng)年有關(guān)全國兩會的新聞報道中。這標(biāo)志著中國人工智能主播技術(shù)迅速成熟,具有實際應(yīng)用意義。站立式女主播可以根據(jù)相應(yīng)播報內(nèi)容展示肢體動作,聲音更具有親和力[4]。
2020年,新華社聯(lián)合搜狗推出3D人工智能合成主播“新小微”,在視覺上還原了真人發(fā)膚,在立體感、靈活度、可塑性、交互能力等多個方面的設(shè)計上進(jìn)行了全方位的優(yōu)化[5],增加了播報內(nèi)容時真人情感的肢體和表情外露。
除了新華社,以央視、新京報為代表的主流媒體也在積極研究推進(jìn)人工智能主播技術(shù)發(fā)展。2018年5月2日,在CCTV13的特別報道《直播長江》中,虛擬主持人“康曉輝”與記者在現(xiàn)場進(jìn)行對話互動、表演繞口令,聲音和形象都栩栩如生[6]。從新聞畫面里可以了解到,虛擬主持人“康曉輝”并不是提前制作好的動畫,而是實時操控的畫面[7]。此外,央視與百度公司合作推出的人工智能手語主播在2022年北京冬奧會中投入使用,服務(wù)世界聽力障礙人士,彰顯人文關(guān)懷。
北京廣播電視臺充分利用臺內(nèi)資源,挖掘傳統(tǒng)廣播電視臺的轉(zhuǎn)型路徑,將臺內(nèi)當(dāng)家主持人春妮的形象轉(zhuǎn)化為數(shù)字化形象,發(fā)布中國首個廣播級智能交互真人數(shù)字人“時間小妮”,處于業(yè)內(nèi)的“第一梯隊”。央視在對其的評價中提到,“以往,其他主流媒體生產(chǎn)的數(shù)字人產(chǎn)品多集中在人工智能主播領(lǐng)域,而‘時間小妮則側(cè)重于用戶服務(wù)功能,以人工智能和情景對話的形式為用戶奉上貼心服務(wù)”[8]。
湖南衛(wèi)視數(shù)字主持人“小漾”取名靈感源于英文單詞“Young”,寓意與湖南衛(wèi)視立臺理念“年輕與青春”相符?!靶⊙迸c當(dāng)代20歲左右的年輕人一樣,對事物充滿激情和熱愛,同時又自信、陽光。她現(xiàn)在的定位是實習(xí)主持人,后續(xù)她將在湖南衛(wèi)視的各類綜藝、晚會中完成輔助人類主持人溝通節(jié)目環(huán)節(jié)、活躍現(xiàn)場氣氛等工作。
2021年6月17日,神舟十二號載人飛船發(fā)射圓滿成功,中國空間站迎來了新華社數(shù)字記者、全球首位數(shù)字航天員“小諍”,它承擔(dān)著載人航天工程、探月工程、深空探測工程等國家重大航天項目的現(xiàn)場報道任務(wù)[9]。近段時間,“小諍”主要駐扎在中國空間站天和核心艙,并“游歷”于國際空間站、和平號空間站,講述有趣的航空航天知識。
人工智能主播雖然在信息傳播、娛樂和其他領(lǐng)域中發(fā)揮著重要作用,但其在語音合成、情感模擬、信息質(zhì)量和人際互動等方面仍存在一系列功能局限。
(一)語音合成的局限
當(dāng)前人工智能主播的語音在自然度和流利度方面,雖然語音合成技術(shù)不斷改進(jìn),但人工智能主播的語音仍然難以與人類語音的自然度和流利度媲美。有時,人工智能主播的語音可能顯得機(jī)械或生硬,難以模擬真實人類的表達(dá)和情感。
在口音和方言方面,語音合成技術(shù)在處理多種口音和方言時可能面臨困難。人工智能主播的語音可能無法準(zhǔn)確模擬特定地區(qū)或群體的語音特征,導(dǎo)致觀眾難以理解或認(rèn)同。
(二)情感模擬的局限
人工智能主播通常是基于預(yù)先編程的腳本和算法運行的,缺乏人類的創(chuàng)造性和情感深度,通常無法提供與人類一樣的情感深度和情感互動,尤其是在復(fù)雜的情境下。其情感模擬的準(zhǔn)確性依賴情感識別技術(shù)[10]。雖然已經(jīng)有了不少進(jìn)展,但情感識別仍然不夠精確,可能導(dǎo)致人工智能主播錯誤地理解或回應(yīng)用戶的情感。并且,它們難以真實地理解和回應(yīng)用戶的情感需求,導(dǎo)致在某些情境下顯得冷漠或不夠體貼。
(三)信息質(zhì)量和可靠性的局限
缺乏判斷能力。人工智能主播通常是基于預(yù)先編程的算法運行的,缺乏人類的判斷和驗證能力。因此,難以準(zhǔn)確識別和過濾虛假信息,容易傳播不準(zhǔn)確或誤導(dǎo)性的信息。
信息源的可信性。人工智能主播獲取的信息往往來自各種渠道,難以評估信息源的可信性,因此可能傳播未經(jīng)驗證的信息。
信息失真和誤解。雖然自然語言處理技術(shù)不斷改進(jìn),但人工智能主播仍然存在對語義和上下文的理解挑戰(zhàn)。這可能導(dǎo)致信息的失真和誤解,使其與原意相去甚遠(yuǎn)。
多義性問題。人工智能主播難以準(zhǔn)確理解和解釋多義性的語言表達(dá),這可能導(dǎo)致信息誤解。
專業(yè)領(lǐng)域知識限制。人工智能主播通常不具備特定領(lǐng)域的專業(yè)知識,只能提供基本的信息和答案,難以解決復(fù)雜問題或提供有深度的見解,因此在特定領(lǐng)域的信息傳遞中可能出現(xiàn)局限。
(四)人際互動的局限
人工智能主播無法完全替代真正的人際互動[11]。人類之間的情感聯(lián)系和復(fù)雜互動不僅依賴語音和圖像模擬,還包括非語言溝通和情感互動。預(yù)先編程的腳本和算法運行限制了人工智能主播在實時互動中的表現(xiàn),其難以應(yīng)對實時互動和復(fù)雜對話,特別是在需要迅速適應(yīng)情境的情況下。
此外,人工智能主播難以進(jìn)行非語言溝通,如肢體語言、面部表情和眼神交流,這限制了其在建立深刻的情感聯(lián)系方面的能力[12]。
隨著技術(shù)的不斷進(jìn)步,人工智能主播功能局限正在逐漸減弱,Google的WaveNet和OpenAI的GPT-3聲音合成模型可以生成逼真的人類聲音。而Deepfake技術(shù)的顯著進(jìn)展,能夠使人工智能主播以令人難以分辨的方式模擬人的臉部表情。
據(jù)國際數(shù)據(jù)公司(IDC)的統(tǒng)計,計算機(jī)視覺市場預(yù)計在未來五年內(nèi)以每年20%的復(fù)合年增長率增長,這些技術(shù)進(jìn)步都為人工智能主播在未來的發(fā)展和應(yīng)用提供了更多機(jī)會。
(一)個性化和定制化
未來的人工智能主播可以通過為受眾精準(zhǔn)畫像,根據(jù)受眾的需求和喜好進(jìn)行個性化和定制化,以提供更具吸引力的用戶體驗,包括調(diào)整語音特點、情感回應(yīng)以及提供特定領(lǐng)域的信息和建議。
由此可見,客戶發(fā)展的需求促使定制化的人工智能主播產(chǎn)生。例如,市場需要播報體育賽事信息的人工智能主播,可根據(jù)體育賽事觀眾信息了解需求進(jìn)行人工智能主播設(shè)計,使其達(dá)到體育賽事播報的資格要求。
同時,隨著相關(guān)技術(shù)的成熟,人工智能主播或能實時將手機(jī)屏幕文字轉(zhuǎn)換成語音,并支持用戶根據(jù)個人喜好挑選語音包,擁有自己的專屬主播。顯而易見的是,這項技術(shù)將為社會中的視障用戶群體提供極大便利[13]。
(二)情感化發(fā)展,貼合溫度
人工智能主播的情感化發(fā)展首要目標(biāo)是提高情感識別和模擬能力。這包括更好的語音情感分析和情感識別技術(shù),使人工智能主播能夠感知用戶的情感狀態(tài),并以相應(yīng)的方式互動。情感模擬將包括更自然的情感表達(dá)和聲音情感合成,使人工智能主播的語音和表情更貼近真實[14]。
未來,人工智能主播將能夠提供更個性化的情感回應(yīng),能根據(jù)用戶的個性、偏好和情感需求,調(diào)整情感表達(dá)和互動方式[15],以更好地滿足用戶的需求。這些調(diào)整有助于提供情感支持和心理健康方面的應(yīng)用。人工智能主播可以成為孤獨人群的情感伴侶,提供更富有情感的互動體驗,也可以用于心理治療、情感識別和干預(yù)。
(三)智慧化升級,貼合智能高度
一直以來,人工智能領(lǐng)域朝著貼合人性智慧發(fā)展需求演化,由于傳媒行業(yè)是面向社會受眾的,所以其對主持人綜合能力和知識儲備的檢驗也是全方位的。人工智能主持人需要不斷完善社會知識儲備與增加人情味,不僅僅是語言,還有肢體、表情管理與智能的聯(lián)動配合,如此才能更好地滿足社會受眾的需求。
此外,傳媒行業(yè)需要與社會保持密切聯(lián)系,特別是對社會的熱點新聞需要及時捕捉,這樣才能更好地實現(xiàn)與公眾的互動,更好地開展工作。為此,人工智能主播必須不斷豐富知識儲備,以滿足社會發(fā)展的需求。
人工智能主播是一個備受矚目的技術(shù)領(lǐng)域,雖然其在功能上存在一些局限,但未來仍有巨大的發(fā)展?jié)摿ΑkS著技術(shù)的不斷進(jìn)步,人工智能主播的語音和表情模擬能力將得到優(yōu)化提升,情感模擬將更加深入,應(yīng)用領(lǐng)域?qū)⒌玫綌U(kuò)展,倫理和法律框架將逐漸完善。人工智能主播有望在未來成為更普遍的工具,為人們提供娛樂、信息和服務(wù)。但在發(fā)展過程中需謹(jǐn)慎處理倫理和法律問題,以確保其使用的合法性。
參考文獻(xiàn):
[1] 王鶴.人工智能時代職業(yè)主持人應(yīng)有的堅守與變革[J].互聯(lián)網(wǎng)周刊,2022(22):67-69.
[2] 孫昊.人工智能技術(shù)在媒體信息生產(chǎn)與傳播中的應(yīng)用研究[J].信息與電腦(理論版),2022,34(5):153-155.
[3] 陳峰.賽博空間虛擬偶像的亞文化構(gòu)建與迷群崇拜研究[D].長春:吉林大學(xué),2023.
[4] 劉萍.媒體融合背景下主流媒體語態(tài)變革的守正創(chuàng)新[D].長春:長春工業(yè)大學(xué),2023.
[5] 陶一萍.以技術(shù)創(chuàng)新打造精品融媒體產(chǎn)品:新華社智能化編輯部兩會報道的實踐與思考[J].中國傳媒科技,2020(6):11-13.
[6] 賈軍.媒體智能化背景下的新聞生產(chǎn)研究[D].武漢:武漢大學(xué),2020.
[7] 白秀梅,徐世民.虛擬主播在應(yīng)急氣象影視節(jié)目制作中的應(yīng)用探討[J].黑龍江氣象,2020,37(2):31-32.
[8] 李偉良.廣播電視和網(wǎng)絡(luò)視聽行業(yè)“次元偶像”現(xiàn)況探究[J].廣播電視信息,2022,29(5):18-20.
[9] 綜合.虛擬數(shù)字人“走進(jìn)”生活[J].現(xiàn)代班組,2022(3):16.
[10] 劉大誠.人工智能情緒識別應(yīng)用研究[J].中國高新科技,2019(13):59-62.
[11] 任秋璇.從主持傳播角度淺析人工智能背景下主持人被替代的可能性:以新華社“AI合成主播”為例[J].視聽,2019(12):146-147.
[12] 衛(wèi)艷菲.人工智能技術(shù)下視頻新聞的新嬗變[J].傳播與版權(quán),2021(5):4-6,9.
[13] 戴偉. AI主播的人性化傳播實踐與探索[J].視聽,2023(2):140-143.
[14] 王十. AI主播的擬態(tài)話語研究[D].天津:天津師范大學(xué),2023.
[15] 呂欣,許倩.萬物互聯(lián)與人機(jī)共生:新冠肺炎疫情期間的網(wǎng)絡(luò)傳播實踐與思考[J].傳媒,2021(4):23-25.
作者簡介 段華,副教授,研究方向:播音主持業(yè)務(wù)、大型賽事體育展示、新媒體傳播。陶玉潔,研究方向:新媒體傳播。秦暢,研究方向:新媒體傳播。