□畢文佳
人工智能主播又被稱為虛擬機器合成主播,是以電子信息仿真技術(shù)為依托、人工智能技術(shù)為驅(qū)動,在基于互聯(lián)網(wǎng)技術(shù)建構(gòu)的諸多全媒體平臺中充當“信息采篩”主持與“信息解碼”播報角色的智能化媒介產(chǎn)品。人工智能主播在技術(shù)變革發(fā)展的不同時代進行著轉(zhuǎn)型升級,呈現(xiàn)出不同的功能特征,繪制了分散式的演化路徑,這是智媒傳播AI技術(shù)的未來研究重點與應(yīng)用方向,對我國智媒傳播的發(fā)展具有重要意義。
現(xiàn)階段的人工智能主播以AI 合成技術(shù)為依托,在實際應(yīng)用過程中逐漸顯示出離身認知與具身認知的交互融合特征。例如:用戶在實際使用過程中賦能基礎(chǔ)特征、功能、代號及名字,增強了人工智能主播的具身性,從而也推動了“主播”主體的人格化進程,進而“名人主播復(fù)制版”型AI主播泛化,也呈現(xiàn)了離身認知與具身認知的有效交互。
人工智能技術(shù)在多種媒介呈現(xiàn)形式上都有留痕,特別是大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)、區(qū)塊鏈及5G的植入促成了人工智能“人”具備數(shù)據(jù)采集、整合、處理、分發(fā)的功能,具備了強大的存儲、分析、永動等技術(shù)特征。而播音與主持藝術(shù)的專業(yè)性和獨特性集中體現(xiàn)在“人”的個性化語言表達,無論是語言表達中的“情景再現(xiàn)”“內(nèi)在語”“對象感”內(nèi)部技巧呈現(xiàn),還是“停連、重音、語氣、節(jié)奏”的外部技巧要求,都呈現(xiàn)了主持人“二度創(chuàng)作”“個性化”“人格化”的播音主持特征。
人工智能輔助技術(shù)同播音與主持藝術(shù)的有效融合,可通過兩方面呈現(xiàn):一方面,主持藝術(shù)的語言表達呈現(xiàn)可用數(shù)據(jù)化、標準化量值形成程序代碼,對于“人工智能”技術(shù)的革新與輔助提供可計算性元素智庫存儲,為“機械化”過渡“人格化”助力,使AI 主播在形象、音韻、情感等維度進行創(chuàng)新性打造,促進信息傳播報道更具情感化色彩;另一方面,智能技術(shù)的集優(yōu)化、擬人化升級拓寬了人工智能主播的應(yīng)用領(lǐng)域,不僅助力于媒介生產(chǎn)與生活,而且滲透到萬物互聯(lián)的全媒體傳播生態(tài)各個環(huán)節(jié)中,使“藝術(shù)”賦能“技術(shù)”,推動了人工智能主播的進一步發(fā)展。
第一,人工智能語音轉(zhuǎn)化技術(shù)。語音轉(zhuǎn)化技術(shù)一方面是對現(xiàn)有文字符號進行有聲化轉(zhuǎn)述,此技術(shù)多應(yīng)用于定制化、模板化的新聞生產(chǎn)輸出,如天氣預(yù)報等,可提升新聞智能化呈現(xiàn)的時度效。另一方面是對已有語料庫的人物語音識別、采集、復(fù)制、重組。聲音不再是一種獨具特色與個人色彩的傳播介質(zhì),而是在技術(shù)的作用下變成了一種可復(fù)制、可生產(chǎn)的傳播介質(zhì)。
2018年《創(chuàng)新中國》紀錄片的配音工作是我國利用人工智能語音轉(zhuǎn)化技術(shù)的初探,利用采集與重組編輯了已故配音演員李易的聲音,被業(yè)界人士稱為全球首個利用人工智能語音技術(shù)完成解說與配音的大型國家紀錄片。其技術(shù)原理為,確定文本內(nèi)容并向設(shè)備中錄入需要模擬的聲音素材,形成文本智庫與聲源智庫,利用智能技術(shù)分析重組。在此過程中,人工智能的自我學習深化及對需要模仿對象的吐字發(fā)音細節(jié)掌控,相對精準。
就目前技術(shù)發(fā)展來看,人工智能技術(shù)已經(jīng)實現(xiàn)了對聲音的批量化生產(chǎn),這種近似流水線的生產(chǎn)模式不僅能提高相關(guān)節(jié)目的解說與配音效率,節(jié)省大量時間,還能有效避免發(fā)音不清、讀錯字情況的出現(xiàn),在一定程度上降低了人力資源的消耗。但該技術(shù)目前受到特定文本的制約和限制,并未完全實現(xiàn)自動化與智能化,提取發(fā)音音頻的方式也并不能使其擺脫對特定文本的依賴,這為未來的技術(shù)革新破題提供了路徑方向。
第二,人工智能語音合成技術(shù)。語音合成技術(shù)指的是情感語音合成與語音篩選回饋技術(shù),技術(shù)人員的主管程序植入使“機器人”主播具備智能語音對話的互動,在技術(shù)內(nèi)部實現(xiàn)了機器的自動化檢索與輸出,實現(xiàn)了交互融合功能。具體來說,在情感語音合成技術(shù)的推動下,人工智能主播能根據(jù)文本內(nèi)容和聲音素材的特點,對其中所蘊含的情感進行分析和把握,在充分了解當前語境的情況下利用自生產(chǎn)能力與對話管理能力來實現(xiàn)與人類的智能語音對話與自然語言應(yīng)答。語音合成技術(shù)廣泛植入于物聯(lián)網(wǎng)鏈接下的全員媒介、手機等大眾小屏媒介終端設(shè)備及智能家電、可觸性穿戴設(shè)備。在全媒體傳播生態(tài)建構(gòu)的過程中,“中央廚房”及“智媒體”融合中心的內(nèi)容生產(chǎn)部門,利用高質(zhì)量的人工智能語音合成技術(shù)有效、快速識別新聞場景,加速新聞生產(chǎn),豐富新聞內(nèi)容,從而為后續(xù)的人機協(xié)同與交互奠定了基礎(chǔ)。
第三,人工智能語音交互技術(shù)。語音交互技術(shù)的有效應(yīng)用實現(xiàn)了人工智能主播在虛擬與物理現(xiàn)實中的雙重多模態(tài)交互。具體來說,人工智能主播可分為實體形態(tài)與虛擬形態(tài)兩種,而就目前情況來看,虛擬形態(tài)的人工智能機器人在動態(tài)化交互技術(shù)的作用下,已經(jīng)能對相應(yīng)人物進行掃描與虛擬生成,從而為觀眾展現(xiàn)出較為逼真的虛擬真人形象或具有鮮明個人色彩的卡通動漫形象;而對于實體形態(tài)的機器人來說,其內(nèi)部配備的高清人像掃描設(shè)備能對相應(yīng)人物的運動或表情變化進行追蹤,并通過追蹤結(jié)果自動化生成與之相對應(yīng)的微表情、肢體動作及語言,實現(xiàn)對人類動作或語言的識別與準確回應(yīng)。盡管人工智能主播能在動態(tài)化交互技術(shù)的輔助下,將真人轉(zhuǎn)變?yōu)楦鞣N虛擬模型,但技術(shù)人員還應(yīng)在使用該技術(shù)的同時注重觀眾的觀感體驗,盡可能使人工智能主播擺脫目前這種介于真人與虛擬之間的局面,對其外觀可能造成的傳播影響進行分析和研究,從而找尋人工智能主播的發(fā)展出路。
人工智能主播的形象產(chǎn)品定位和功效能率產(chǎn)出共同決定了其“人格化”的偏向與特征,通常用戶會將人工智能主播定位為社會角色中的先賦角色,即有“對象化”的模擬賦能形成一種新型角色關(guān)系。這種關(guān)系性角色是人類用戶與人工智能主播或機器人進行協(xié)同合作與交互的基礎(chǔ)和保障。技術(shù)人員和算法工程師能夠利用角色轉(zhuǎn)變技術(shù)為人工智能主播賦能,使其具有高度融洽的運行邏輯與運行模式,而正是由于這種融洽性,人工智能主播即使配備了各類先進技術(shù),也只能以非自然人的身份與人類用戶進行交流與互動。若出現(xiàn)了媒體等同,比如在明確其同類機器人身份的情況中,相關(guān)人員也只能通過相關(guān)技術(shù)手段來對人工智能主播的社會臨場感加以調(diào)整,使其站在人類用戶理性角度上盡可能滿足使用者的需求。不僅如此,在人工智能主播的設(shè)計階段,為了使人工智能主播能更好地在現(xiàn)實生活中扮演先賦角色,設(shè)計者和算法工程師以人類社會為依托,在對現(xiàn)實生活群體的活動特征與相應(yīng)效能進行分析的基礎(chǔ)上,加強了人工智能主播在人臉識別與建模、動作捕捉、情感遷移等方面的功能,從而使其生成的AI 分身模型更具人性化色彩,以至于最大限度上貼近了目標人類主播的各方面特征。
盡管數(shù)據(jù)推送在新聞生產(chǎn)的分發(fā)環(huán)節(jié)應(yīng)用日趨嫻熟,但是在當下人工智能主播的“私人定制”式多元化內(nèi)容生產(chǎn)及輸出表現(xiàn)較弱。當下人工智能主播還未能針對不同的節(jié)目形態(tài)及需求呈現(xiàn)出多元的能力和個性化的展示,實現(xiàn)媒介生產(chǎn)的供需滿足與平衡發(fā)展。目前還沒有一項技術(shù)能真正使其脫離人工干預(yù),主持人的能力素養(yǎng)也無法通過當前的技術(shù)完全賦能于人工智能主播。人工智能技術(shù)的個性化呈現(xiàn)強調(diào)的是對不同場景進行功能識別與功能產(chǎn)出。對于人工智能主播來說,這種功能細化能進一步加強其人格化特征,使其在多維度“仿真”的建構(gòu)進程中可以無限近似于人,增強人工智能自身的深度學習。用戶可在使用和交互中注意到人工智能主播的個性化表現(xiàn),從而增強用戶的人際交往感知。不僅如此,態(tài)度與行為也能對用戶使用人工智能主播產(chǎn)生一定的影響。比如,用戶對人工智能的現(xiàn)有態(tài)度、個性特征等會對人工智能的應(yīng)用產(chǎn)生相對應(yīng)的作用;而人工智能主播在為用戶提供個性化定制與推薦服務(wù)時,也會受到用戶習慣偏好與行為習慣的影響。因此技術(shù)人員可通過對用戶信息進行分析來調(diào)整和優(yōu)化人工智能主播的參數(shù),從而提升用戶的使用滿意度,加快人工智能主播的發(fā)展步伐。
在全媒體傳播生態(tài)的建構(gòu)進程中提出了全媒體的定義解讀,即全程、全息、全員、全效。技術(shù)視域下的全息傳播實踐,是為了打通物理世界與虛擬世界的邊界,利用人工智能技術(shù)、虛擬現(xiàn)實影像技術(shù)、物聯(lián)網(wǎng)5G 技術(shù)實現(xiàn)立體化、環(huán)繞式傳播,力圖在元宇宙初探時建構(gòu)虛擬媒介生態(tài),真正實現(xiàn)無障礙的虛實空間交互傳播。具體來說,現(xiàn)有的人工智能主播還僅存在于二維空間的智能設(shè)備屏幕中,這種具有單向性的視聽范式雖能有效滿足人類用戶的需求,但卻會在一定程度上削減人工智能主播與人類用戶進行多模態(tài)感官交互的效果。而在全息投影技術(shù)的支撐下,AI 主播與真人主播可以呈現(xiàn)共時空同畫面的方式展示在用戶面前,利用虛擬現(xiàn)實VR眼鏡等身體感官延伸終端,可以真切地讓受眾感受到“在場”。人工智能主播元宇宙空間的“超媒介”生產(chǎn)應(yīng)用,即人工智能主播能夠在各種場景和環(huán)境中使用,從某種角度來說能夠擺脫空間的限制,在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)與虛擬現(xiàn)實技術(shù)的多重作用下,實現(xiàn)了數(shù)據(jù)信息、人類用戶與機器之間的有效連接。
雖然“主持人”是否會被人工智能主播所取代的議題仍爭辯不斷,但是主持人利用AI主播提升職業(yè)素養(yǎng),進行高可信度的人際、大眾傳播實踐卻在有條不紊地進行。人工智能技術(shù)的輔助能夠幫助播音主持人、記者采集海量數(shù)據(jù)信息,輔助直播連線與即興采訪報道;輔助新聞主播進行“備稿”重音停連的劃分;輔助綜藝類主持人進行受眾的情緒態(tài)度抓取及滿意度微表情反饋等,人機的協(xié)同共生讓我們真正向往“賽博格”的無邊界化、交融互動的創(chuàng)新優(yōu)勢互補。當下人工智能主播的發(fā)展困境不僅是技術(shù)壁壘,在數(shù)字信息技術(shù)及編程解碼賦值上,跨界的計算機技術(shù)人員難以掌握藝術(shù)的要領(lǐng)與特殊的職業(yè)技巧知識,更重要的是用戶的接受程度與需求程度。最新研究表明,在新聞生產(chǎn)領(lǐng)域,特殊的類型化新聞內(nèi)容生產(chǎn),人工智能的新聞生產(chǎn)采編播所收獲的可信度高于職業(yè)媒體人的參與。這表明,當下用戶的媒介使用與媒介反饋都產(chǎn)生著較大的變革,這與社會經(jīng)濟發(fā)展緊密相關(guān),也與使用媒介的類別、方式、頻率相關(guān)。而主持人這一依托于傳統(tǒng)媒介誕生的媒介元素,是否會在新型的媒介生態(tài)建構(gòu)中重新尋找、拓展自身的價值,挖掘職業(yè)效能取決于是否能夠真正落地“人機協(xié)同”與“優(yōu)勢互補”。
媒介融合的深化是“人”與“技術(shù)”的融合,而傳播生態(tài)的建構(gòu)是社會角色的轉(zhuǎn)變與傳受關(guān)系的重構(gòu)。人工智能主播打破了原有傳受關(guān)系,其自身存儲的海量信息數(shù)據(jù)與對文本的高速識別重組能力,大大超出人類本身的能力限度。而千人千面的大數(shù)據(jù)私人定制與不間斷的深化學習,更能讓“技術(shù)”了解、幫助、滿足“人”的需求,從而使人工智能主播更具人性化、個性化、觀眾緣。未來人工智能主播會朝著個性化與差異化的方向發(fā)展,人工智能主播未來有機會成為每位人類用戶的私用物品,相應(yīng)的差異化定制與個性化社交功能也會進一步得到提升,人類用戶也會利用人工智能主播來實現(xiàn)對自我角色的有效延伸與拓展。
人工智能主播改變著社會關(guān)系及數(shù)字化時代中的人際交往關(guān)系,在互聯(lián)網(wǎng)與大數(shù)據(jù)技術(shù)的推動下,人類用戶與人工智能主播之間的關(guān)系更具數(shù)字化與虛擬化特征,而當這種數(shù)字化程度發(fā)展到一定程度時,人工智能主播就會脫離人工的控制與束縛,依賴各類算法對相應(yīng)的新聞報道進行審核和明確。這種方式具有更高的準確性與公平性,削弱了新聞媒體報道中的主觀性,盡可能減少或降低了人類主觀意識與情感的影響,使得人類用戶與人工智能主播的關(guān)系得到重新構(gòu)建。
當下,全媒體傳播生態(tài)正在建構(gòu),媒體融合的深化過程中,核心技術(shù)是發(fā)展基礎(chǔ)。人工智能技術(shù)參與媒介生態(tài)建構(gòu)的重要呈現(xiàn)就是人工智能主播的生產(chǎn)、演化、發(fā)展、應(yīng)用。我國人工智能主播在現(xiàn)階段的發(fā)展中還存在著一系列問題。因此研究人員與算法工程師必須及時轉(zhuǎn)變傳統(tǒng)觀念與思維,利用先進的技術(shù)手段來對人工智能主播進行優(yōu)化與創(chuàng)新,盡可能增強其個性化與智能化特征,從而為人類用戶提供更高質(zhì)量的服務(wù),使其“人”與“技術(shù)”互構(gòu)的張力作用充分發(fā)揮出來,從而增強用戶黏度、用戶信度、用戶效度,推動智能媒體傳播的健康發(fā)展。