亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

人工智能主播的功能局限和未來發(fā)展可行性研究

2024-04-06 19:13:13段華陶玉潔秦暢

新聞研究導(dǎo)刊 2024年3期

段華陶玉潔秦暢

摘要：人工智能技術(shù)的支撐，打開了媒體行業(yè)發(fā)展新格局。當(dāng)前，這一發(fā)展成果被應(yīng)用到傳播領(lǐng)域，人工智能主播出現(xiàn)在大眾視野。文章通過分析人工智能主播建設(shè)的戰(zhàn)略格局及其所呈現(xiàn)出來的功能局限，評估其未來發(fā)展的可行性，旨在拓展人工智能主播研究新視角、延伸人工智能主播應(yīng)用新思路，進(jìn)而推動傳媒產(chǎn)業(yè)、人工智能主播產(chǎn)業(yè)的發(fā)展。文章結(jié)合北京人民廣播電臺真人數(shù)字人“時間小妮”、湖南衛(wèi)視數(shù)字主持人“小漾”以及新華社數(shù)字記者、全球首位數(shù)字航天員“小諍”的應(yīng)用情況，借鑒和參考中國播音學(xué)、傳播學(xué)、計算機(jī)科學(xué)以及人工智能等相關(guān)學(xué)科的知識，針對人工智能主播在廣播領(lǐng)域的發(fā)展現(xiàn)狀，探析如何挖掘人工智能主播的潛力與價值，得出人工智能主播雖然在信息傳遞、娛樂和其他領(lǐng)域中發(fā)揮著重要作用，但在語音合成、情感模擬、信息質(zhì)量和人際互動等方面存在一系列功能局限的結(jié)論。文章指出，受眾對人工智能主播的接受度與其功能水平密切相關(guān)，需要更多的技術(shù)創(chuàng)新和用戶體驗優(yōu)化來推動其進(jìn)一步發(fā)展。未來，人工智能主播將凸顯其在信息傳播和用戶互動方面的潛在價值，朝著定制化、情感化、智慧化的方向發(fā)展，通過人工智能技術(shù)為受眾精準(zhǔn)畫像并進(jìn)行個性化分析，推送個性化內(nèi)容，提高受眾的依賴度。

關(guān)鍵詞：人工智能主播；應(yīng)用現(xiàn)狀；功能局限；發(fā)展路徑；未來方向

中圖分類號：G222.2；TP18 文獻(xiàn)標(biāo)志碼：A 文章編號：1674-8883（2024）03-0005-03

課題項目：本論文為2022年度廣東省本科高校在線開放課程指導(dǎo)委員會研究課題“關(guān)于在線開放課程驅(qū)動高校混合教學(xué)變革研究——以普通話語音課程為例”成果，項目編號：2022ZXKC267

一、我國人工智能主播發(fā)展現(xiàn)狀

目前，我國的人工智能主播建設(shè)普遍呈現(xiàn)以“主流媒體引導(dǎo)、互聯(lián)網(wǎng)公司技術(shù)支持”為特點的戰(zhàn)略格局。在實際應(yīng)用方面，人工智能主播的進(jìn)化發(fā)展呈現(xiàn)出從聲音文本到智能語音對話的轉(zhuǎn)化[1]，再到多模態(tài)交互的“三步走”戰(zhàn)略，研究進(jìn)度走在世界前列。

在2018年第五屆世界互聯(lián)網(wǎng)大會上，新華社聯(lián)合搜狗公司推出世界首個全仿真智能主持人“新小浩”。該智能主播以主持人邱浩為原型，可以根據(jù)實際需要選擇漢語或英語播報，實現(xiàn)了“聲音的文本轉(zhuǎn)化”初步設(shè)想[2]。但由于當(dāng)時技術(shù)有限，所以首個全仿真智能主持人只能“坐播”，無法添加相關(guān)聯(lián)的肢體動作[3]。

2019年，新華社與搜狗公司聯(lián)合發(fā)布全新升級的站立式、女性人工智能主播“新小萌”，并投入當(dāng)年有關(guān)全國兩會的新聞報道中。這標(biāo)志著中國人工智能主播技術(shù)迅速成熟，具有實際應(yīng)用意義。站立式女主播可以根據(jù)相應(yīng)播報內(nèi)容展示肢體動作，聲音更具有親和力[4]。

2020年，新華社聯(lián)合搜狗推出3D人工智能合成主播“新小微”，在視覺上還原了真人發(fā)膚，在立體感、靈活度、可塑性、交互能力等多個方面的設(shè)計上進(jìn)行了全方位的優(yōu)化[5]，增加了播報內(nèi)容時真人情感的肢體和表情外露。

除了新華社，以央視、新京報為代表的主流媒體也在積極研究推進(jìn)人工智能主播技術(shù)發(fā)展。2018年5月2日，在CCTV13的特別報道《直播長江》中，虛擬主持人“康曉輝”與記者在現(xiàn)場進(jìn)行對話互動、表演繞口令，聲音和形象都栩栩如生[6]。從新聞畫面里可以了解到，虛擬主持人“康曉輝”并不是提前制作好的動畫，而是實時操控的畫面[7]。此外，央視與百度公司合作推出的人工智能手語主播在2022年北京冬奧會中投入使用，服務(wù)世界聽力障礙人士，彰顯人文關(guān)懷。

北京廣播電視臺充分利用臺內(nèi)資源，挖掘傳統(tǒng)廣播電視臺的轉(zhuǎn)型路徑，將臺內(nèi)當(dāng)家主持人春妮的形象轉(zhuǎn)化為數(shù)字化形象，發(fā)布中國首個廣播級智能交互真人數(shù)字人“時間小妮”，處于業(yè)內(nèi)的“第一梯隊”。央視在對其的評價中提到，“以往，其他主流媒體生產(chǎn)的數(shù)字人產(chǎn)品多集中在人工智能主播領(lǐng)域，而‘時間小妮則側(cè)重于用戶服務(wù)功能，以人工智能和情景對話的形式為用戶奉上貼心服務(wù)”[8]。

湖南衛(wèi)視數(shù)字主持人“小漾”取名靈感源于英文單詞“Young”，寓意與湖南衛(wèi)視立臺理念“年輕與青春”相符?！靶⊙迸c當(dāng)代20歲左右的年輕人一樣，對事物充滿激情和熱愛，同時又自信、陽光。她現(xiàn)在的定位是實習(xí)主持人，后續(xù)她將在湖南衛(wèi)視的各類綜藝、晚會中完成輔助人類主持人溝通節(jié)目環(huán)節(jié)、活躍現(xiàn)場氣氛等工作。

2021年6月17日，神舟十二號載人飛船發(fā)射圓滿成功，中國空間站迎來了新華社數(shù)字記者、全球首位數(shù)字航天員“小諍”，它承擔(dān)著載人航天工程、探月工程、深空探測工程等國家重大航天項目的現(xiàn)場報道任務(wù)[9]。近段時間，“小諍”主要駐扎在中國空間站天和核心艙，并“游歷”于國際空間站、和平號空間站，講述有趣的航空航天知識。

二、人工智能主播的功能局限

人工智能主播雖然在信息傳播、娛樂和其他領(lǐng)域中發(fā)揮著重要作用，但其在語音合成、情感模擬、信息質(zhì)量和人際互動等方面仍存在一系列功能局限。

（一）語音合成的局限

當(dāng)前人工智能主播的語音在自然度和流利度方面，雖然語音合成技術(shù)不斷改進(jìn)，但人工智能主播的語音仍然難以與人類語音的自然度和流利度媲美。有時，人工智能主播的語音可能顯得機(jī)械或生硬，難以模擬真實人類的表達(dá)和情感。

在口音和方言方面，語音合成技術(shù)在處理多種口音和方言時可能面臨困難。人工智能主播的語音可能無法準(zhǔn)確模擬特定地區(qū)或群體的語音特征，導(dǎo)致觀眾難以理解或認(rèn)同。

（二）情感模擬的局限

人工智能主播通常是基于預(yù)先編程的腳本和算法運行的，缺乏人類的創(chuàng)造性和情感深度，通常無法提供與人類一樣的情感深度和情感互動，尤其是在復(fù)雜的情境下。其情感模擬的準(zhǔn)確性依賴情感識別技術(shù)[10]。雖然已經(jīng)有了不少進(jìn)展，但情感識別仍然不夠精確，可能導(dǎo)致人工智能主播錯誤地理解或回應(yīng)用戶的情感。并且，它們難以真實地理解和回應(yīng)用戶的情感需求，導(dǎo)致在某些情境下顯得冷漠或不夠體貼。

（三）信息質(zhì)量和可靠性的局限

缺乏判斷能力。人工智能主播通常是基于預(yù)先編程的算法運行的，缺乏人類的判斷和驗證能力。因此，難以準(zhǔn)確識別和過濾虛假信息，容易傳播不準(zhǔn)確或誤導(dǎo)性的信息。

信息源的可信性。人工智能主播獲取的信息往往來自各種渠道，難以評估信息源的可信性，因此可能傳播未經(jīng)驗證的信息。

信息失真和誤解。雖然自然語言處理技術(shù)不斷改進(jìn)，但人工智能主播仍然存在對語義和上下文的理解挑戰(zhàn)。這可能導(dǎo)致信息的失真和誤解，使其與原意相去甚遠(yuǎn)。

多義性問題。人工智能主播難以準(zhǔn)確理解和解釋多義性的語言表達(dá)，這可能導(dǎo)致信息誤解。

專業(yè)領(lǐng)域知識限制。人工智能主播通常不具備特定領(lǐng)域的專業(yè)知識，只能提供基本的信息和答案，難以解決復(fù)雜問題或提供有深度的見解，因此在特定領(lǐng)域的信息傳遞中可能出現(xiàn)局限。

（四）人際互動的局限

人工智能主播無法完全替代真正的人際互動[11]。人類之間的情感聯(lián)系和復(fù)雜互動不僅依賴語音和圖像模擬，還包括非語言溝通和情感互動。預(yù)先編程的腳本和算法運行限制了人工智能主播在實時互動中的表現(xiàn)，其難以應(yīng)對實時互動和復(fù)雜對話，特別是在需要迅速適應(yīng)情境的情況下。

此外，人工智能主播難以進(jìn)行非語言溝通，如肢體語言、面部表情和眼神交流，這限制了其在建立深刻的情感聯(lián)系方面的能力[12]。

三、人工智能主播未來發(fā)展方向

隨著技術(shù)的不斷進(jìn)步，人工智能主播功能局限正在逐漸減弱，Google的WaveNet和OpenAI的GPT-3聲音合成模型可以生成逼真的人類聲音。而Deepfake技術(shù)的顯著進(jìn)展，能夠使人工智能主播以令人難以分辨的方式模擬人的臉部表情。

據(jù)國際數(shù)據(jù)公司（IDC）的統(tǒng)計，計算機(jī)視覺市場預(yù)計在未來五年內(nèi)以每年20%的復(fù)合年增長率增長，這些技術(shù)進(jìn)步都為人工智能主播在未來的發(fā)展和應(yīng)用提供了更多機(jī)會。

（一）個性化和定制化

未來的人工智能主播可以通過為受眾精準(zhǔn)畫像，根據(jù)受眾的需求和喜好進(jìn)行個性化和定制化，以提供更具吸引力的用戶體驗，包括調(diào)整語音特點、情感回應(yīng)以及提供特定領(lǐng)域的信息和建議。

由此可見，客戶發(fā)展的需求促使定制化的人工智能主播產(chǎn)生。例如，市場需要播報體育賽事信息的人工智能主播，可根據(jù)體育賽事觀眾信息了解需求進(jìn)行人工智能主播設(shè)計，使其達(dá)到體育賽事播報的資格要求。

同時，隨著相關(guān)技術(shù)的成熟，人工智能主播或能實時將手機(jī)屏幕文字轉(zhuǎn)換成語音，并支持用戶根據(jù)個人喜好挑選語音包，擁有自己的專屬主播。顯而易見的是，這項技術(shù)將為社會中的視障用戶群體提供極大便利[13]。

（二）情感化發(fā)展，貼合溫度

人工智能主播的情感化發(fā)展首要目標(biāo)是提高情感識別和模擬能力。這包括更好的語音情感分析和情感識別技術(shù)，使人工智能主播能夠感知用戶的情感狀態(tài)，并以相應(yīng)的方式互動。情感模擬將包括更自然的情感表達(dá)和聲音情感合成，使人工智能主播的語音和表情更貼近真實[14]。

未來，人工智能主播將能夠提供更個性化的情感回應(yīng)，能根據(jù)用戶的個性、偏好和情感需求，調(diào)整情感表達(dá)和互動方式[15]，以更好地滿足用戶的需求。這些調(diào)整有助于提供情感支持和心理健康方面的應(yīng)用。人工智能主播可以成為孤獨人群的情感伴侶，提供更富有情感的互動體驗，也可以用于心理治療、情感識別和干預(yù)。

（三）智慧化升級，貼合智能高度

一直以來，人工智能領(lǐng)域朝著貼合人性智慧發(fā)展需求演化，由于傳媒行業(yè)是面向社會受眾的，所以其對主持人綜合能力和知識儲備的檢驗也是全方位的。人工智能主持人需要不斷完善社會知識儲備與增加人情味，不僅僅是語言，還有肢體、表情管理與智能的聯(lián)動配合，如此才能更好地滿足社會受眾的需求。

此外，傳媒行業(yè)需要與社會保持密切聯(lián)系，特別是對社會的熱點新聞需要及時捕捉，這樣才能更好地實現(xiàn)與公眾的互動，更好地開展工作。為此，人工智能主播必須不斷豐富知識儲備，以滿足社會發(fā)展的需求。

四、結(jié)語

人工智能主播是一個備受矚目的技術(shù)領(lǐng)域，雖然其在功能上存在一些局限，但未來仍有巨大的發(fā)展?jié)摿ΑｋS著技術(shù)的不斷進(jìn)步，人工智能主播的語音和表情模擬能力將得到優(yōu)化提升，情感模擬將更加深入，應(yīng)用領(lǐng)域?qū)⒌玫綌U(kuò)展，倫理和法律框架將逐漸完善。人工智能主播有望在未來成為更普遍的工具，為人們提供娛樂、信息和服務(wù)。但在發(fā)展過程中需謹(jǐn)慎處理倫理和法律問題，以確保其使用的合法性。

參考文獻(xiàn)：

[1] 王鶴.人工智能時代職業(yè)主持人應(yīng)有的堅守與變革[J].互聯(lián)網(wǎng)周刊，2022（22）：67-69.

[2] 孫昊.人工智能技術(shù)在媒體信息生產(chǎn)與傳播中的應(yīng)用研究[J].信息與電腦（理論版），2022，34（5）：153-155.

[3] 陳峰.賽博空間虛擬偶像的亞文化構(gòu)建與迷群崇拜研究[D].長春：吉林大學(xué)，2023.

[4] 劉萍.媒體融合背景下主流媒體語態(tài)變革的守正創(chuàng)新[D].長春：長春工業(yè)大學(xué)，2023.

[5] 陶一萍.以技術(shù)創(chuàng)新打造精品融媒體產(chǎn)品：新華社智能化編輯部兩會報道的實踐與思考[J].中國傳媒科技，2020（6）：11-13.

[6] 賈軍.媒體智能化背景下的新聞生產(chǎn)研究[D].武漢：武漢大學(xué)，2020.

[7] 白秀梅，徐世民.虛擬主播在應(yīng)急氣象影視節(jié)目制作中的應(yīng)用探討[J].黑龍江氣象，2020，37（2）：31-32.

[8] 李偉良.廣播電視和網(wǎng)絡(luò)視聽行業(yè)“次元偶像”現(xiàn)況探究[J].廣播電視信息，2022，29（5）：18-20.

[9] 綜合.虛擬數(shù)字人“走進(jìn)”生活[J].現(xiàn)代班組，2022（3）：16.

[10] 劉大誠.人工智能情緒識別應(yīng)用研究[J].中國高新科技，2019（13）：59-62.

[11] 任秋璇.從主持傳播角度淺析人工智能背景下主持人被替代的可能性：以新華社“AI合成主播”為例[J].視聽，2019（12）：146-147.

[12] 衛(wèi)艷菲.人工智能技術(shù)下視頻新聞的新嬗變[J].傳播與版權(quán)，2021（5）：4-6，9.

[13] 戴偉. AI主播的人性化傳播實踐與探索[J].視聽，2023（2）：140-143.

[14] 王十. AI主播的擬態(tài)話語研究[D].天津：天津師范大學(xué)，2023.

[15] 呂欣，許倩.萬物互聯(lián)與人機(jī)共生：新冠肺炎疫情期間的網(wǎng)絡(luò)傳播實踐與思考[J].傳媒，2021（4）：23-25.

作者簡介段華，副教授，研究方向：播音主持業(yè)務(wù)、大型賽事體育展示、新媒體傳播。陶玉潔，研究方向：新媒體傳播。秦暢，研究方向：新媒體傳播。