景沛瑤
(四川師范大學 成都 610011)
AI主播,即AI合成主播,是搜狗與新華社共同開發(fā)并于2018年11月7日在第五屆世界互聯(lián)網(wǎng)大會上首次出現(xiàn)的。AI主播的誕生引發(fā)了業(yè)界和學界關(guān)于播音主持藝術(shù)界是否會被其沖擊的焦慮,很多從業(yè)者都體現(xiàn)出了對于職業(yè)前景的擔憂。在算法推薦、智能語音等技術(shù)愈發(fā)先進的腳步中,現(xiàn)有的電視新聞將會發(fā)生大的技術(shù)變革,相關(guān)行業(yè)的人才變更也會加快,并且對從業(yè)者提出更高的要求。主持人該如何適應全新的環(huán)境,如何擁抱技術(shù)、尋找機遇和創(chuàng)造價值?
隨著語音技術(shù)的發(fā)展,現(xiàn)在的智能語音系統(tǒng)能夠輕易合成主持人的聲音、音色、語氣等,合成效果與真人無二。合成主播的出現(xiàn)更是將有關(guān)播音主持的話題推上風口浪尖,使電視新聞節(jié)目主持人面臨著被替代的風險。主持人將面臨著語音審美、上鏡表達以及工作強度的多重挑戰(zhàn)。
語音,是人的發(fā)音器官發(fā)出的具有一定社會意義的聲音,也是人類最早的傳播媒介。現(xiàn)在的智能語音技術(shù)已經(jīng)融入人們的日常生活,比如智能手機上普遍存在的語音助手,像華為的小E,蘋果的Siri,小米的小愛同學等;還有各種識別度很高的語音輸入、智能音箱,都是智能語音技術(shù)的產(chǎn)物。智能語音播報豐富了播音主持的樣態(tài),也體現(xiàn)出了數(shù)字科技與人文傳播的重疊交叉與緊密結(jié)合。
2018年11月7日,搜狗與新華社合作開發(fā)、全球第一個全仿真智能虛擬主持人即“合成主播”在第五屆世界互聯(lián)網(wǎng)大會上正式亮相。2019年3月3日,全球首位合成女主播正式上崗,成為了新華社的一員。她的形象為中英文雙語女主播,再加上人工采編、搜狗分身的智能語音、圖像等技術(shù),對真人的新聞播報進行模擬,呈現(xiàn)出了與真人幾乎一致的播報效果。
“AI合成主播”能高產(chǎn)量地進行音視頻合成,并且24小時不間斷地輸出效果。這些操作能夠大大降低新聞幕后工作者在新聞后期制作中花費的各種成本,新聞視頻的制作效率也會有極大的提高。新聞的移動化、互動化、智能化將是大勢所趨。2017年3月21日,東方衛(wèi)視推出電視新聞欄目《小冰搖搖吧》,在這個節(jié)目中,主持人微軟小冰以“互聯(lián)網(wǎng)大數(shù)據(jù)播報員”的身份出現(xiàn),能夠在收集數(shù)據(jù)的同時,進行線上采訪和評論,甚至還會唱歌和朗誦,與真人主持的互動也十分流暢自然。從看新聞到體驗新聞,科技和虛擬主持人的發(fā)展顯然能夠提供更大的信息量以及更多的刺激點,未來也會有更多的人工智能和虛擬主播擁有現(xiàn)實世界的社會化角色,進入人們的視野。
除了在新聞直播間,合成主播還可以在官方網(wǎng)站和各種社交媒體平臺上工作,也能夠24小時不間斷,大幅度提升了辦公質(zhì)量和效率。比如在新華社客戶端去年9月13日發(fā)布的新聞中,“AI合成主播”在21:13:57和21:14:17發(fā)布了兩條時長分別為40秒和48秒的新聞,語氣、狀態(tài)與真人主播都沒有明顯差別,且更新速度快、時間間隔短,可見,合成主播不會受到時間和情緒影響,始終播報狀態(tài)積極,水平發(fā)揮穩(wěn)定。由此可見,合成主播擁有和真人主播同樣甚至更加出色的播報能力,并且可以隨意切換中、英文,既不會出錯,也不用休息,與真人主播相比,具有效率高、產(chǎn)量大的優(yōu)勢。
共情/移情能力,從情感視角和認知視角來說,指的是一種通過對于別人情緒和處境的理解,最大限度地對于別人的經(jīng)歷和處境感同身受的能力。目前,人工智能無法擁有人類的情感和判斷能力,自然也沒有共情能力。人類雖然不完美,但是有時候的”不完美”也呈現(xiàn)出另外一種“完美”,比如在播報2008年的5·12大地震的新聞中,幾度哽咽的央視主持人趙普。這種“瑕疵”,是人工智能不會出現(xiàn)的人性之光,這些“瑕疵”,也恰恰成為了最令人動容、令人感同身受的畫面。
與真人相比,AI主播的現(xiàn)場表現(xiàn)能力依舊有待提高。比如主持人在特定情況下,會通過自己的職業(yè)素養(yǎng)和應變能力靈活處理意外發(fā)生的情況,而AI虛擬主播目前還無法做到隨機應變,只能根據(jù)已有的數(shù)據(jù)指令機械地完成命令。在2016年4月12日晚的《新聞聯(lián)播》中,出現(xiàn)了幾秒沒有解說和同期聲的空鏡頭,主播王寧反應迅速,立即流利地口播了一條新聞,避免了直播事故的發(fā)生??梢?,新聞節(jié)目對于主持人的應變能力也有較高的要求。
人類與人工智能最本質(zhì)的區(qū)別就在于人工智能僅是物質(zhì)世界范疇的概念,無法跨越到意識領(lǐng)域,人工智能是對人的思維的模擬,而非思維本身。因此,目前的人工智能不具有人腦意識的相對獨立性和主觀能動性。并且播音主持的創(chuàng)作過程中還需要主持人的二度創(chuàng)作,除有聲語言外,肢體副語言、發(fā)型、服飾等都屬于二度創(chuàng)作,二度創(chuàng)作既能增強新聞傳播的影響力,又能提升個人形象,塑造個人品牌。而反觀人工智能,只能在理性層面上學習,卻無法在感性層面上創(chuàng)作。因此,真人主播的創(chuàng)作能力也是主持人不可替代性的表現(xiàn)。
主持人是具有互動性的、需要很強理解力以及高度個性化的職業(yè),特別是在綜藝、訪談節(jié)目中需要的互動、應變、理解能力尤為突出。而對于新聞節(jié)目主持人來說,理解的深淺決定著新聞播音主持的質(zhì)量高低,是否將應有的情感色彩表達到位。比如2019年7月25日的《新聞聯(lián)播》中,主播康輝播報了一篇題為《究竟誰在全球到處欺侮恫嚇他人?》的國際銳評,其中,“不愿打,但也不怕打,必要時不得不打”等語句擲地有聲、大快人心??递x的播報,充分體現(xiàn)了播音主持語言特點中的“三性三感”:規(guī)范性、莊重性、鼓動性;時代感、分寸感、親切感[1]。這與康輝自己的專業(yè)素養(yǎng)、對于稿件的理解感受以及二度創(chuàng)作的能力是分不開的。
人工智能技術(shù)會改變播音主持的傳播形態(tài)和生產(chǎn)方式,同時也加快了播音主持與其它媒體的融合。“媒介融合”的概念最早在20世紀七八十年代的美國產(chǎn)生,一言以蔽之,就是將彼此不同的傳播媒介結(jié)合在一起使用,而扭結(jié)和實現(xiàn)這種結(jié)合的便是不斷成熟的互聯(lián)網(wǎng)技術(shù)。[2]
5G時代的來臨,使得每一個人都能成為傳播者,媒體機構(gòu)將會面臨與用戶在同一起跑線上競爭的局面,媒體與其它行業(yè)的邊界也會進一步消融,媒介的相互融合勢必會形成新的產(chǎn)物,新聞節(jié)目也會發(fā)生相應的變化。媒介不僅僅是傳統(tǒng)新聞媒體的“輿論領(lǐng)袖”,也是人工智能的“信息管家”和“貼身顧問”[3],雙方可以共贏發(fā)展。
首先是專業(yè)素養(yǎng)。如今,先進的智能語音系統(tǒng)能夠通過足量的數(shù)據(jù)積累,成功掌握一個人的語言表達方式,但是,數(shù)據(jù)是AI的唯一燃料,是AI的唯一驅(qū)動力,智能語音系統(tǒng)依然需要有最根本的可學習的語音數(shù)據(jù),而人的個性化語音才是獨一無二的創(chuàng)作源頭。因此不能因為出現(xiàn)了先進的技術(shù),就放松最基本的專業(yè)訓練,最優(yōu)秀的主持人的音頻、視頻材料永遠是人工智能最根本的學習來源。
其次是文化素養(yǎng)。從目前人工智能發(fā)展的情況可以看出,有一定難度的新聞播音,只要在智能語音系統(tǒng)積累一定的數(shù)據(jù)、學習一段時間之后也是可以完成的。更何況,并不是每一個主持人都能成為行業(yè)頂尖并最終成為人工智能的學習來源。但AI合成主播的背后,仍然需要真人作者和編輯提供和審核播報內(nèi)容,這些內(nèi)容就需要主持人提高自己的文化素養(yǎng)和技術(shù)水平。主持人應在媒介融合的過程中發(fā)現(xiàn)新的方式、摸索新的方向,將人工智能與自身能力配合起來,相互協(xié)同和補充,增強自己的應變能力和解決問題的實際能力。
人工智能的發(fā)展會對傳統(tǒng)的播音主持特別是新聞節(jié)目造成一定沖擊,但科技的進步并不只意味著淘汰,更多的是提供機會和創(chuàng)造價值。在全媒體時代下,5G的萬物互聯(lián)會進一步打破傳統(tǒng),將人與人、人與世界的互聯(lián)互通上升到生理級、心理級的互聯(lián)互通,造就出新的新聞媒介形態(tài)。新聞節(jié)目主持人需要緊跟時代潮流,掌握先進技術(shù),加強自身建設(shè),提高文化素養(yǎng),做到專業(yè)化與智能化結(jié)合,取得更好的自身發(fā)展?!?/p>