王晨 陳栓緊
摘要:隨著新技術(shù)的成熟,全球首個AI主播于2018年誕生。AI主播有哪些優(yōu)勢能為傳媒業(yè)所用?未來AI主播又會何去何從?這些問題都值得研究。文章基于國內(nèi)外AI主播的研究現(xiàn)狀,梳理了AI主播的發(fā)展階段及特征,試論AI主播產(chǎn)生的影響,并就AI主播的應(yīng)用場景提出建議。
關(guān)鍵詞:AI主播;新聞媒體;應(yīng)用場景
中圖分類號:G210.7 文獻(xiàn)標(biāo)志碼:A 文章編號:1674-8883(2021)22-0007-03
一、引言
2017年,人工智能寫入國務(wù)院政府工作報告;2019年,中央全面深化改革委員會第七次會議審議通過《關(guān)于促進(jìn)人工智能和實(shí)體經(jīng)濟(jì)深度融合的指導(dǎo)意見》。此后,人工智能逐步與經(jīng)濟(jì)社會各領(lǐng)域“擁抱”,孕育出不少卓越成果。根據(jù)微軟和永安、清科數(shù)據(jù)測算,至2022年,中國人工智能市場規(guī)模預(yù)計(jì)將超過千億元。在此背景下,2018年,新華社推出首個AI主播,開創(chuàng)了新聞領(lǐng)域?qū)崟r音頻與AI真人形象合成的先河。它在為傳統(tǒng)媒體與人工智能的深度融合提供又一典型范例的同時,也促使人們思考AI主播與傳統(tǒng)主播的優(yōu)劣及其未來的應(yīng)用場景。
二、AI主播的特征
AI主播可定義為基于“自然交互+知識計(jì)算”智能理念,結(jié)合語音及形象合成技術(shù),向觀眾展現(xiàn)出生動逼真?zhèn)鬟_(dá)效果的主播,它主要有三個特征。
(一)極具擬人化傳播效果
AI主播大多脫胎于真人主播,他們是對真實(shí)主播形象的“復(fù)制”,通過對真人主播進(jìn)行技術(shù)性建模得到極具擬人化的軀體和聲音。例如新華社AI主播“新小微”,她是以新華社記者趙琬微為原型生成的,可以根據(jù)不同的新聞內(nèi)容和場景,利用AI算法實(shí)時驅(qū)動自身形態(tài)、面部表情,變換服飾、發(fā)型等。逼真的外形、真實(shí)的擬人動作,讓AI主播具象性與真人感并存,對觀眾來說,有效營造出了新聞播報的現(xiàn)場氛圍。另外,AI主播減少了人為控制的因素。新聞編輯人員只需將要播報的文本數(shù)據(jù)輸入AI主播對應(yīng)的程序中,它就能基于自身的數(shù)據(jù)庫輸出語音、視頻,方便快捷,且有效避免了傳統(tǒng)新聞主播在新聞播報過程中出現(xiàn)的漏字、錯字、別字等問題,或是打哈欠、打噴嚏等不可控的突發(fā)生理問題,為人們提供更及時、更廣泛的服務(wù)和更客觀的新聞。
(二)24小時待命實(shí)時傳遞信息
AI主播全天候在崗,可隨時為網(wǎng)絡(luò)平臺播報新聞,即使在凌晨,依然能以飽滿的狀態(tài)傳遞信息,有效緩解了真人主播的播報壓力,分擔(dān)了一定的工作任務(wù)。如在新華社客戶端中,AI主播曾在凌晨0點(diǎn)52分播報新聞,其工作狀態(tài)依舊良好,這有效增強(qiáng)了新聞畫面的可觀賞性,提高了新聞的時效性。再如,科大訊飛推出的多語種AI主播“小晴”,在全國兩會期間,第一時間運(yùn)用中、英、日、韓等語言播報會議最新動態(tài),有效加快了中國媒體國際傳播的步伐,壓縮了對外發(fā)聲的時間差,也為中國媒體走向世界贏得了新的機(jī)遇與條件。
(三)智能數(shù)據(jù)處理減少制作成本
馬歇爾·麥克盧漢在《理解媒介:論人的延伸》中提到一種觀點(diǎn)——“媒介是人的延伸”[1]。AI主播依托數(shù)據(jù)存在,它的背后有特定的行業(yè)數(shù)據(jù)庫。AI主播不僅能夠播報新聞,而且能從數(shù)據(jù)庫中調(diào)取優(yōu)質(zhì)且精確的內(nèi)容,進(jìn)行數(shù)字化處理,總結(jié)出內(nèi)在邏輯、規(guī)律。目前,實(shí)時的交通、天氣、體育賽事等節(jié)目都需要提前開展大量的數(shù)據(jù)采集和組織工作,AI主播能充分發(fā)揮自身優(yōu)勢,保證數(shù)據(jù)采集和集成的效率。隨著技術(shù)的不斷改進(jìn),AI主播依靠其強(qiáng)大的數(shù)據(jù)庫,不斷挑戰(zhàn)真人主播的位置。如在央視網(wǎng)絡(luò)春晚的舞臺上,以節(jié)目主持人撒貝寧為模板的AI機(jī)器人“小小撒”登場,他不僅能夠?qū)υ?,還能夠背誦詩詞,進(jìn)行簡單互動。新華社AI主播上崗以來,已實(shí)現(xiàn)量產(chǎn),參與了互聯(lián)網(wǎng)大會、進(jìn)博會、春運(yùn)、春節(jié)等重要新聞報道,通過新華社客戶端、新華網(wǎng)、短視頻平臺播放,引發(fā)國內(nèi)外媒體的廣泛關(guān)注。
三、AI主播的發(fā)展歷程
AI主播的合成,需要強(qiáng)大的技術(shù)支持,根據(jù)技術(shù)呈現(xiàn)效果的差異,可將AI主播的發(fā)展歷程分為兩個階段。
(一)起步階段
在這一階段,AI主播大多以三維虛擬形象出現(xiàn),表情及動作較為僵硬,且耗時耗力,制作成本較高。2001年,世界上第一個人工智能虛擬主持人阿娜諾娃(Ananova)出現(xiàn),CNN將其描述為一個堪比真實(shí)的有血有肉的主播。隨后,日本、韓國等國家都推出了自己的人工智能主持人。2004年,CCTV—6頻道推出了國內(nèi)首位虛擬電視節(jié)目主持人—小龍。他采用3D形象設(shè)計(jì),將金城武、劉德華、梁朝偉的面部優(yōu)勢吸收再重塑,負(fù)責(zé)主持《光影周刊》欄目。雖然在形式上有了重大突破,但事實(shí)上,起步階段的AI主播播報一期節(jié)目的成本甚至超過傳統(tǒng)主播。制作團(tuán)隊(duì)需要對聲音、形象進(jìn)行單獨(dú)制作,將其嵌入合并,再進(jìn)行三維程序制作,過程復(fù)雜煩瑣。
(二)探索階段
隨著科技發(fā)展,技術(shù)的成熟,AI主播逐漸趨于真實(shí)。2016年,科大訊飛、百度等相關(guān)科技企業(yè),在發(fā)布會上表示其人工智能的語音識別率已高達(dá)97%。人工智能語音識別技術(shù)的精確性,在一定程度上助推了AI主播進(jìn)入市場的進(jìn)程。2018年5月,AI主播“康小輝”亮相,這位AI主持人是由科大訊飛打造,與央視主持人康輝外形相似?!翱敌≥x”相比以往的AI主播,最大的不同在于不再需要高昂成本,只需簡單設(shè)備便可播報新聞。2018年11月8日,第五屆全球互聯(lián)網(wǎng)大會上,搜狗與人工智能合作的AI主播“新小浩”面世,“新小浩”幾近完美地克隆了新華社男主播邱浩,從形象到聲音,從唇形到動作,幾乎是邱浩的“翻版”。2019年2月,“新小浩”由坐式變?yōu)檎玖⑹剑憩F(xiàn)形式更加豐富。隨后“新小萌”“麗莎”等AI主播紛紛亮相。
在探索階段,我們能清晰地感受到AI主播越來越接近真實(shí)人類,服飾、性別等方面也做到了切換自如,制作成本越來越低,時間越來越短,技術(shù)不斷升級迭代。
四、AI主播與傳統(tǒng)主播的對比分析
(一)價值取向?qū)Ρ?/p>
由技術(shù)創(chuàng)造出的物品都有一定的價值取向。技術(shù)帶來的價值取向通常表現(xiàn)在這種技術(shù)的使用途徑和方式上。對比來看,AI主播盡管實(shí)現(xiàn)了量產(chǎn),但其作用依然是模仿、替代。他不是憑空創(chuàng)造出來的仿真數(shù)字人像,而是通過綜合描繪某一真實(shí)主播的身體特征、身份信息而產(chǎn)生的。通過數(shù)據(jù)的調(diào)動和記錄,盡力去“克隆”傳統(tǒng)主播,實(shí)現(xiàn)信息輸出的目標(biāo)。
但信息的傳播往往不是一個單向循環(huán)的簡單過程,而是不斷突破、再創(chuàng)造的行為。在傳媒業(yè),判斷一個主播是否優(yōu)秀,播音時長、出現(xiàn)頻次都不是關(guān)鍵所在,更重要的是對新聞稿件進(jìn)行有思想力的表現(xiàn),更可以表達(dá)為對新聞的再加工創(chuàng)造。傳統(tǒng)主播可以合理運(yùn)用自身情感營造新聞浸入感,而且傳統(tǒng)主播在多次實(shí)踐播音后能夠從中提煉技巧,升華自身技藝,從而得到“1+1>2”的創(chuàng)新效果,但AI主播在當(dāng)前的技術(shù)條件下,多次播音后,依然只能機(jī)械地念稿,盡力去模仿、還原傳統(tǒng)主播,并不能自我提升,得到的是“1+1=2”的效果。
(二)播出效果對比
播音的效果方面,不得不說,AI主播比傳統(tǒng)主播更加穩(wěn)定。因?yàn)锳I主播是由數(shù)據(jù)計(jì)算合成的3D數(shù)字人,不會存在像傳統(tǒng)主播一樣的生理問題、情緒波動等,遇到突發(fā)狀況時,AI主播也能毫無波瀾地完成新聞播報工作。反觀傳統(tǒng)主播,人們時常會在社交網(wǎng)絡(luò)或短視頻平臺刷到傳統(tǒng)主播的失誤合集,有的是流鼻涕、打哈欠、補(bǔ)妝等,有的是大笑、忘詞等,這在一定程度上都影響了節(jié)目播出的效果。那么AI主播在播音效果上絕對優(yōu)異嗎?當(dāng)然不是,因?yàn)槿斯ぶ悄軝C(jī)器人是靠數(shù)據(jù)發(fā)出聲音,而非聲帶發(fā)聲,這就導(dǎo)致他們播音時存在兩個問題。
第一是表達(dá)機(jī)械化,缺乏語流音變。人們在用普通話交流時,時常會出現(xiàn)兒化音、變調(diào)、多音字、輕聲等,而AI主播是多音節(jié)連續(xù)輸出,不能掌握全面的音變規(guī)律,導(dǎo)致播音時的機(jī)械性較強(qiáng)。如AI主播“新小浩”在一次兩會新聞播報中,讀到“什么東西最難攜帶?”中的“西”字時依然用陰平方式發(fā)聲,并未音變?yōu)檩p聲,這容易讓人混淆。第二是停頓不當(dāng),導(dǎo)致新聞邏輯不明。面對播報中的長句子,AI主播很容易停頓不當(dāng),導(dǎo)致語義邏輯不順。
綜上所述,在播音效果方面,傳統(tǒng)主播和AI主播各有優(yōu)劣,不能一概而論。
(三)情感互動對比
莎士比亞曾言,“一千個人眼中有一千個哈姆雷特”,這正是人類情感各異、思想存在差別的表現(xiàn)。人工智能作為一項(xiàng)技術(shù),可以讓虛擬主播利用后臺程序的數(shù)據(jù)表達(dá)理解情感,但無法真正感受情感。面對相同的稿件,不同的傳統(tǒng)主播會有不同的表達(dá)方式,會有不同的場景創(chuàng)設(shè),更有不同的理解。而AI主播只能根據(jù)程序的設(shè)定程式化地回應(yīng),進(jìn)而表達(dá),缺乏深層內(nèi)涵,不能做到言志傳神。缺乏情感的表達(dá),是AI主播的劣勢?;臃矫妫珹I主播目前主要應(yīng)用于新聞播報中,不需要與觀眾互動交流。但AI主播的應(yīng)用范圍不僅僅在新聞播報領(lǐng)域,還會在采訪、綜藝節(jié)目中出現(xiàn),面對這樣的場景,AI主播很難招架。如在采訪中,傳統(tǒng)主播能夠根據(jù)嘉賓的回答延伸,現(xiàn)場隨機(jī)變換問題,讓主播和嘉賓形成良性互動。在綜藝節(jié)目中,主播需要把控觀眾情緒,又要照顧舞臺效果,這樣一來,主播不再只是見字發(fā)聲的機(jī)器,而是更需互動、以人為本的高素質(zhì)主持人。
這樣來看,AI主播與傳統(tǒng)主播對比,缺少情感表達(dá),缺乏互動性。
五、AI主播帶來的影響
(一)對傳統(tǒng)主播的影響
AI主播出現(xiàn)之后,是否能替代傳統(tǒng)主播呢?有不少學(xué)者對此進(jìn)行了研究。各方文章認(rèn)為AI主播的出現(xiàn)對傳統(tǒng)主播產(chǎn)生了三點(diǎn)影響。
一是迫使傳統(tǒng)主播不斷提高業(yè)務(wù)水平。在數(shù)據(jù)較多的財(cái)政股票、新聞類節(jié)目中可以看出,AI主播處理新聞時的精確度和標(biāo)準(zhǔn)度是傳統(tǒng)主播無法比擬的,傳統(tǒng)主播主持節(jié)目時很難保證沒有意外發(fā)生,但是AI主播可以100%避免這些失誤,這在無形中敦促傳統(tǒng)主播不斷提高自身業(yè)務(wù)水平。
二是倒逼傳統(tǒng)主播尋求職業(yè)上的轉(zhuǎn)型升級。AI主播已經(jīng)在媒體平臺量產(chǎn)播稿,他們通過文本的輸入就能實(shí)現(xiàn)仿真式的播音,自動合成音、視頻,高效且便捷。傳統(tǒng)主播隊(duì)伍中存在個別缺乏特色且不上進(jìn)的主播,AI主播的出現(xiàn)一定程度上會讓這些主播面臨失業(yè)危機(jī),倒逼其創(chuàng)新進(jìn)步,不斷提高理論修養(yǎng)、自身素質(zhì)。
三是有利于形成良性競爭的環(huán)境。
(二)對傳媒業(yè)態(tài)的影響
傳媒業(yè)處在變革時期,AI主播是順勢而生的創(chuàng)新產(chǎn)物。最直接的影響是AI主播直接提高了新聞的收視率,但收視率的提高并非因?yàn)閮?nèi)容,更多是因?yàn)樾问健U绫A_·萊文森“媒介演進(jìn)三階段(玩具—鏡子—藝術(shù))”理論所言,新技術(shù)在初期被當(dāng)作“玩具”,人們新奇于它的形式。當(dāng)?shù)竭_(dá)“鏡子”階段后,人們開始逐步關(guān)注媒介表達(dá)的內(nèi)容,最終上升為后現(xiàn)實(shí)“藝術(shù)”[2]。所以AI主播在短期內(nèi)會增加新聞的閱讀量,但人們把它當(dāng)作“技術(shù)玩具”,當(dāng)人們適應(yīng)甚至是厭倦了這樣一種播音模式,傳媒業(yè)又會恢復(fù)常態(tài)。傳統(tǒng)的傳媒業(yè)重心在采、編、播。現(xiàn)下,這三項(xiàng)工作有了人工智能的輔助,變得更加輕松,傳媒業(yè)的工作重心將會逐漸偏向于把關(guān)。技術(shù)雖然讓傳媒業(yè)態(tài)變得高效快捷,但我們不能因此失去對新聞的掌控力。任何時候,當(dāng)人失去對技術(shù)的控制,后果將不堪設(shè)想。在人工智能給新聞業(yè)態(tài)提供了極大便利的情況下,我們更加需要對新聞生產(chǎn)進(jìn)行把關(guān),明確信息的真實(shí)性,維護(hù)傳媒業(yè)的公信力。
(三)對社會發(fā)展的影響
彭蘭教授認(rèn)為新媒體具有三大特征,即萬物皆媒、自我進(jìn)化、人機(jī)共生,這預(yù)示著傳媒業(yè)與智能技術(shù)交互協(xié)作將是大勢所趨[3]。
可以預(yù)見的是,未來傳媒業(yè)要把人工智能當(dāng)作輔助工具,使新聞生產(chǎn)更快捷、新聞信息傳遞更準(zhǔn)確、表現(xiàn)形式更生動,一步步推動傳媒業(yè)轉(zhuǎn)型升級。
放眼世界,發(fā)達(dá)國家高度重視人工智能技術(shù)的發(fā)展,我國也將人工智能作為產(chǎn)業(yè)驅(qū)動力。AI主播的發(fā)展,能夠進(jìn)一步優(yōu)化國家外部環(huán)境,推動國家制定相關(guān)法律政策、完善倫理規(guī)范、引導(dǎo)社會風(fēng)向,讓技術(shù)與經(jīng)濟(jì)更加深入地融合,營造良好數(shù)字生態(tài),建設(shè)數(shù)字中國。
不得不說,AI主播的出現(xiàn)也在一定程度上提升了我國的傳媒影響力,當(dāng)全球第一個AI主播在中國上崗時,不僅在國內(nèi),在國際上也引發(fā)不小的轟動,美國、英國、印度權(quán)威媒體紛紛感慨主播“栩栩如生”,贊嘆中國在人工智能技術(shù)方面的實(shí)力。這無疑向世界展示了“中國創(chuàng)造”的力量,推動產(chǎn)業(yè)創(chuàng)新升級,創(chuàng)造社會價值,為國家高質(zhì)量發(fā)展注入新的動力。
六、結(jié)語
目前,AI主播已能對模式化的信息進(jìn)行播報,這在一定程度上解放了人力資源,但卻不能完全取代傳統(tǒng)主播。因?yàn)槿耸且蛩枷氩町惗?dú)特,人工智能終究是數(shù)字機(jī)器,無法理解情感,也不能自生思想。在不斷創(chuàng)新和變革的工業(yè)4.0時代,傳媒業(yè)應(yīng)該抓住技術(shù)日益成熟的機(jī)遇,讓人工智能技術(shù)更加成熟,探索高質(zhì)高效的人機(jī)合作,實(shí)現(xiàn)人類和技術(shù)的互補(bǔ)。
參考文獻(xiàn):
[1] 麥克盧漢.理解媒介[M].何道寬,譯.北京:商務(wù)印書館,2000:57.
[2] 胡嶸.新媒體視閾下電視新聞主播業(yè)務(wù)素質(zhì)的研究[J].記者觀察,2019(2):27.
[3] 彭蘭.智媒化:未來媒體浪潮:新媒體發(fā)展趨勢報告(2016)[J].國際新聞界,2016,38(11):6-24.
作者簡介 王晨,碩士,研究方向:新聞與傳播。陳栓緊,碩士,研究方向:電影學(xué)。