□ 韓 帥 張麗娜
人工智能由三大核心基礎(chǔ)組成,分別是計算機視覺、機器學習和智能語音。相比機器學習的決策智能、計算機視覺的感官智能,智能語音實現(xiàn)了人類與機器的交流與對話。5G時代的到來、物聯(lián)網(wǎng)的推進,使新聞傳播原有的生產(chǎn)秩序被打破。在新聞傳播環(huán)節(jié)中起到舉足輕重作用的新聞編輯同樣也面臨人工智能的挑戰(zhàn)。對此,通過人工智能語音轉(zhuǎn)變新聞編輯固有的思維模式,將有利于推動新聞媒體在人工智能時代實現(xiàn)變革發(fā)展。
智能語音技術(shù)的實現(xiàn)是由信源、智能語音設(shè)備、接收者三者構(gòu)成的,從信源發(fā)聲后需要智能語音設(shè)備識別,到將信息交由智能語音設(shè)備進行處理后合成聲音傳送給接收對象,智能語音的信息處理均在三者之間展開。然而受目前智能語音中聲音接收技術(shù)的限制,近場語音傳播成為智能語音的主要特性。近場傳播指的是信源與信息接收陣列的距離小于2.048 米的信息傳播距離。反之,信源與信息接收陣列的距離大于2.048 米的傳播距離則為遠場傳播。相比遠場傳播帶來的明顯噪音,降低智能語音識別和接收,近場傳播則在新聞傳媒的信息生產(chǎn)和傳遞中優(yōu)勢明顯。
在新聞生產(chǎn)中,新聞編輯所要轉(zhuǎn)換為文本的語音多來自于新聞發(fā)布會或采訪。這些采訪均在狹小的空間范圍內(nèi)進行,這符合智能設(shè)備在短距離進行語音識別的要求,使記者在采訪的同時就能通過智能接收設(shè)備準確捕獲談話內(nèi)容并翻譯成文本,這為新聞記者采訪后內(nèi)容的整理縮短了時間。智能語音設(shè)備高準確率也規(guī)避了新聞采訪中語音模糊、語音損毀、方言聽不懂等弊端。在新聞傳遞上,虛擬助手、可穿戴設(shè)備、智能車載等設(shè)備特殊的佩戴方式和使用場景,讓語音與用戶交互的距離也被限定在近場傳播中。如在駕車行駛中,用戶與汽車主控臺的距離較短,且主要精力集中在駕駛上,因而更愿意通過智能車載語音收聽新聞訊息。狹小的車廂為智能語音信息的傳遞提供了場地,進而車廂內(nèi)駕駛者或乘員為信息傳遞確立了接收的“靶向”用戶。這就要求新聞編輯抓住智能車載為主的近場傳播這一重要入口,通過對近場傳播入口的占領(lǐng)為所生產(chǎn)的智能語音培養(yǎng)更多的“靶向”用戶。
近年來隨著資本將目光聚焦在體育轉(zhuǎn)播上,世界杯、英超等熱門體育賽事轉(zhuǎn)播權(quán)被集中在少數(shù)的新聞媒體和視頻內(nèi)容平臺手中。而對未能購買到體育視頻報道的其他媒體來說,版權(quán)壁壘使得編輯在對體育賽事進行報道時呈現(xiàn)的賽事內(nèi)容變得有限。體育版權(quán)的壁壘使新聞編輯催生出文字直播、圖文直播的新型信息報道形式,避免了新聞編輯因版權(quán)限制不能對賽事進行視頻直播的尷尬境遇,為用戶提供了了解體育賽事的“另類途徑”。
與視頻直播相比,圖文直播因打字和截圖帶來的時滯性不可避免,同時文字和圖片直播去除了視頻所帶來的沖擊感、畫面感。面對視頻版權(quán)壁壘和圖文直播信息傳遞不理想的兩難境地,智能語音技術(shù)的使用無疑為處在外圍的新聞編輯們提供了全新的賽事信息報道手段和傳播技術(shù)。利用大數(shù)據(jù)信息收集技術(shù)對體育、突發(fā)事件進行信息的實時收集,在智能語音技術(shù)下生成新聞,并進行實時轉(zhuǎn)播。由于智能語音技術(shù)下的信息識別和語音合成都是在數(shù)據(jù)庫和處理器的支持下來完成,計算機強大的數(shù)據(jù)運算能力直接省略了人為進行圖文賽事直播所需要的時間,使得智能語音對體育賽事的傳播接近于直播。同時經(jīng)過后期3D 語音環(huán)繞、特效聲音技術(shù)的融合發(fā)展,可以讓用戶在智能音頻直播下更有“聲臨其境”之感。2016年2月,央視新聞客戶端升級至6.0 版本,支持新聞?wù)Z音播報功能,可以實現(xiàn)“路上輕松聽新聞”,用戶在此功能中聽見的并非電視節(jié)目中新聞主播的播報,而是由人工智能語音合成技術(shù)合成的聲音。在某種意義上,新聞編輯通過智能語音音頻直播規(guī)避了體育賽事版權(quán)的壁壘,為相關(guān)的新聞信息報道提供全新的報道模式。
社交媒體時代,內(nèi)容接收主要通過移動終端來進行,無論是以手機為代表的小屏還是電腦為首的大屏,都因界面不同而使信息接收場景各異,這也就為信息的傳遞提出了挑戰(zhàn),即使是融媒體時代下的一稿多發(fā),新聞編輯還是會根據(jù)不同屏幕來調(diào)整合適的新聞信息傳播格式。設(shè)計師安迪·古德曼(Andy Goodman)將用戶通過點擊或觸摸來獲取信息的行為稱為“零用戶界面”(Zero user interface)?!傲阌脩艚缑妗弊畲蟮奶攸c是擺脫屏幕限制的思維模式,信息的接收和處理主要依靠語音界面來完成操作,在操作過程中,用戶只需記住驅(qū)動智能設(shè)備的命令。面對多種場景帶來的信息生成方式的不同,智能語音造就的“零用戶界面”使新聞信息在不同場景中轉(zhuǎn)換門檻降低。
“零用戶界面”的智能語音技術(shù),作為用戶通過語音向智能設(shè)備獲取信息的入口,其扮演的就是連接不同場景中的中介角色。信息內(nèi)容受屏幕阻隔使接收場景割裂,新聞編輯則根據(jù)“零用戶界面”進行新聞內(nèi)容無障礙生產(chǎn)。在智能語音技術(shù)下的場景中,媒體只需生產(chǎn)一種形式的新聞內(nèi)容,就能在不同的用戶智能語音終端中使用,進而打破了新聞信息在不同信息接收場景下唯一信息傳播形式的閉環(huán),讓不同界面不同場景連接在一起。場景連接為新聞編輯在人工智能時代的信息布局增加了手段。相比多屏分割導(dǎo)致用戶對某一新聞信息的忠誠度較低,了解信息只會短暫地停留在單一屏幕上,智能語音則在時間緯度上擴展了用戶了解信息的時間,增加了用戶對新聞編輯所生產(chǎn)信息的黏性。
隨著智能語音在新聞信息傳播中的應(yīng)用,新聞編輯對語音信息中編輯方針和態(tài)度的把握是必不可少的。編輯方針和態(tài)度主要以新聞編輯的評論和新聞事實的選擇來實現(xiàn)。相比智能語音下新聞評論的直抒胸臆,新聞事實對編輯態(tài)度和方針的展現(xiàn)較為困難。通過對現(xiàn)實生活中副語言的積累,新聞編輯應(yīng)把握不同副語言所表示的態(tài)度,以此形成副語言下智能語音的不同情景,建構(gòu)情景化中的編輯框架。
副語言指的是超音段音位學中的韻律特征(如語調(diào)、重音等)、突發(fā)性特征(如說話時的笑聲、哭泣聲等)以及次要發(fā)音(如圓辱化音、鼻化音等)。這些特征可以表明說話人的態(tài)度、社會地位及其它意義。如在中央電視臺《創(chuàng)新中國》紀錄片的錄制中,智能語音技術(shù)公司科大訊飛利用智能語音技術(shù)通過對著名配音人李易的語氣、音色、節(jié)奏等副語言的模擬還原了李易老師的聲音,讓李易先生的經(jīng)典之聲再次出現(xiàn)在聽眾的面前。此次配音通過對副語言的高度運用突破了智能技術(shù)所生成語音僵硬的尷尬局面。整部記錄片配音與李易老師的真聲相差無幾,在情緒、節(jié)奏、韻律等藝術(shù)表現(xiàn)力上宛若真人。
2017年7月,國務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,明確了我國新一代人工智能發(fā)展的戰(zhàn)略目標。人工智能技術(shù)將不斷促進新聞傳播事業(yè)的改革,對于新聞編輯來說,只有打破智能語音原有的桎梏思維,將用戶思維、創(chuàng)新思維、場景思維、情景思維運用在新聞傳播事業(yè)的改革中去,才能將人工智能的發(fā)展戰(zhàn)略目標落實在行業(yè)中來。此外,本文并未討論人工智能技術(shù)的實際運用以及分析語音技術(shù),因此對于智能語音技術(shù)在新聞編輯中運用的現(xiàn)實問題還有待考察。