任貝佳
【摘? ? 要】伴隨當今社會媒介化的發(fā)展,各廣電媒體先后開始關注和應用虛擬數(shù)字人技術,來為自身的發(fā)展注入新的活力,但同時也暴露出一些亟待解決的問題。本研究在社會行動者理論視域下,將虛擬主持人與受眾的關系劃分為啟動期、發(fā)展期及成熟期三個階段,以便探討二者間的互動模式與特征。研究發(fā)現(xiàn),在啟動期,虛擬主持人在語言表達、非語言表達等方面的一些特質(zhì)能夠有效提升受眾的感知社會在場感,進而提升其對這一技術手段的接受度。在發(fā)展期,則需要注意平衡受眾與虛擬主持人間的交互尺度,從而促進二者間的關系進一步深入。此外,在利用虛擬主持人技術為媒介生產(chǎn)賦能的同時,也要重視對其賦予精神內(nèi)核,才能讓虛擬主持人既擁有專業(yè)能力,也具備“人格”魅力,憑借獨有的特質(zhì)深入人心。
【關鍵詞】虛擬主持人;廣電媒體;社會行動者;社會在場感
自新華社聯(lián)合搜狗公司發(fā)布虛擬主播“新小浩”以來,虛擬主播/主持人便開始進入大眾視野。虛擬主持人是虛擬數(shù)字人在傳媒業(yè)的應用,具有數(shù)字化外形及一定的感知能力、表達能力與交互能力,在媒體中承擔新聞采訪、播報與節(jié)目主持等工作。受新媒體的沖擊,廣電媒體長期以來都在尋求創(chuàng)新發(fā)展。如今社會媒介化進程已成為“當下社會發(fā)展和時代發(fā)展中最重要的主流趨勢與潮流”。[1]國家廣電總局于2020年發(fā)布的《廣播電視技術迭代實施方案(2020-2022年)》中提出,要推動廣電內(nèi)容生產(chǎn)便捷化和智慧化,推動虛擬主播等技術應用在新聞、綜藝、氣象等節(jié)目中。在技術、政策、資本等多重因素的推動下,各大廣電媒體紛紛推出虛擬數(shù)字人,嘗試用新技術為自身的發(fā)展注入新動力。
傳統(tǒng)的新聞主播、主持人需要經(jīng)過嚴格的職業(yè)培訓才能正式上崗,并且許多受觀眾喜愛的主持人不僅具備出色的專業(yè)素養(yǎng),同時還擁有獨特的主持風格與人格魅力。目前看來,虛擬主持人最大的亮點似乎僅僅體現(xiàn)在技術層面。如何在當前的技術條件下,進一步提升虛擬主持人的綜合能力,賦能媒體發(fā)展,并被受眾接受與喜愛值得深究。人與虛擬數(shù)字人關系的連接可分為三個時期:啟動期、發(fā)展期與成熟期[2]。啟動期是指用戶逐漸接受虛擬數(shù)字人的階段,發(fā)展期是指用戶與虛擬數(shù)字人的交互進一步深入,從而在兩者間形成更為緊密關系的階段。本文聚焦于這兩個時期,結合技術應用現(xiàn)狀及相關理論對上述問題進行嘗試性解答,以期為未來虛擬主持人的研究、設計與應用帶來一點啟發(fā)。
一、分析視角:作為社會行動者的虛擬主持人
“計算機是社會行動者”范式(computers are social actors,CASA)是研究人機傳播的一個重要視角。CASA理論認為人們會將計算機看作“社會行動者”,并將社會價值、規(guī)范等套用到計算機上。在學界,許多研究將機器視作社會行動者,分析社會腳本在人機傳播中的適用性。有研究認為,人類對計算機外觀的擬人化,以及人類在人機交互過程中對社會腳本的使用是一種無意識行為。[3]每一種人造技術都會帶有一些社交線索,這會導致人在無意識間將技術視為社交的對象。在這一視角下,虛擬主持人帶有的一些線索可能使受眾將其視為社會行動者,并將相關的社會腳本應用于兩者的交互中。主持人這一職業(yè)在社會中存在已久,并且在受眾心目中形成了一定的社會腳本。社會腳本是社會行動者通過觀察他人行為及學習個人經(jīng)歷得來的,這些腳本被儲存在個體記憶之中,并在將來指導個體的行動。[4]
考察用戶是否會將虛擬數(shù)字人視為社會行動者時,社會在場感是重要指標。受眾對虛擬主持人真實感及親密度的感知,與虛擬主持人的準社會交互都可能會影響受眾對虛擬主持人社會在場感的感知,進而影響受眾對虛擬主持人的接受度等。對于社會在場感的定義并不統(tǒng)一。Lee將社會在場感定義為一種心理狀態(tài),在這一狀態(tài)下,虛擬社會行動者能夠通過感官的或非感官的方式,使人類將其視為現(xiàn)實社會行動者。[5]社會在場感概念包含幾個重要考察指標:(1)“感知真實性”,即用戶是否認為媒介中的人物是真實存在的。(2)“感知心理親密性”,即用戶感知到的與虛擬人物間的親密程度。(3)“準社會交互”,即用戶將自己與媒介或媒介中人物的單向傳播視為雙向傳播的現(xiàn)象[6]。
在CASA范式視角下,由于虛擬主持人帶有與傳統(tǒng)主持人相似的社交線索,受眾與虛擬主持人間的交互可能會應用“受眾與傳統(tǒng)主持人交往”的社會腳本。所以,還有必要關注虛擬主持人的語言和非語言線索,分析在受眾與虛擬主持人關系的啟動期,哪些因素與受眾的感知社會在場感密切相關,進而在未來的設計與研究中能將其納入考量范圍。
二、關系的啟動:虛擬數(shù)字人語言、非語言線索與其他因素
(一)語言線索
語言作為社交線索,在主持人的語境中具有獨特的意義。在傳統(tǒng)電視節(jié)目主持中,因節(jié)目類型的不同及個人個性的差異,主持人會使用不同的語調(diào)、語氣。受眾能通過主持人的語言特征分辨節(jié)目類型,甚至會因為主持人獨特的語言風格而成為該節(jié)目的忠實觀眾。
虛擬主持人的語音生成與二十年前相比,經(jīng)歷了巨大的技術革新。2001年,世界上第一位虛擬主持人“阿娜諾娃”在英國誕生,其說話的內(nèi)容需要工作人員先將文本形式輸入電腦而后生成語音。其聲音生硬且機械感強,與真實人聲相差甚遠。由于深度學習算法的突破,當前人工智能合成音可以更好地模擬人聲變化,甚至達到以假亂真的程度。另外,真人配音也是虛擬數(shù)字人語音生成的一種方式。人工智能合成聲音類虛擬主持人在新聞類節(jié)目中應用較多,工作人員只需將要播報的文字輸入相應的軟件中,虛擬主持人便能順暢地“表達”出來。而有的節(jié)目對主持人語言表達的情緒感染力要求更高,在此情況下虛擬主持人通常會使用真人配音。
提高虛擬主持人聲音擬人化程度可能會提高受眾對虛擬主持人的感知真實性,進而提高感知可信度。有研究認為,人類聲音有其獨特性,這使得與機器合成音相比,人們對于人類聲音更加敏感并樂于回應。Kim等人在研究中發(fā)現(xiàn),擬人化的聲音與機器感明顯的聲音相比,前者會給人們帶來更高的感知可信度,并且社會在場感在聲音類型與感知可信度的關系中做中介變量。[7]因此,虛擬主持人在主持節(jié)目特別是新聞節(jié)目時,擬人化程度高的聲音會使受眾對虛擬主持人的感知社會在場感提升,進而對新聞內(nèi)容產(chǎn)生更高的感知可信度。
可以通過賦予虛擬主持人聲音不同個性的方式,令受眾感知到更高程度的社會在場感。有研究發(fā)現(xiàn),用戶在聽到電腦的聲音風格與自身的個性相似時,會感受到更強的社會在場感,并且這一相關性在性格外向的用戶身上表現(xiàn)得更加明顯。當前對虛擬主持人聲音的設計存在同質(zhì)化現(xiàn)象,千篇一律的聲線很難滿足不同群體的需求。因此,在日后對虛擬主持人的聲音設計中,應當考慮不同群體對聲音個性的偏好,更好地匹配受眾的需求。
(二)非語言線索
除了語言表達,主持人的表情、肢體語言等非語言表達也在節(jié)目主持中傳遞著豐富的信息。相關研究發(fā)現(xiàn),主持人的非語言符號會傳遞給受眾不同的感覺,例如新聞播音員“揚起的眉毛”在某些情境下會令受眾感受到偏見。非語言符號不僅會給受眾帶來不同的認知,甚至還會影響用戶對事件的判斷。有學者發(fā)現(xiàn),在有關選舉的新聞播報過程中,新聞播音員會無意中表達出某些非語言符號,進而表現(xiàn)出自己偏愛的一方,而這也會影響觀眾的看法及選擇。由此可見,對虛擬主持人非語言表達的設計十分重要。
當前虛擬主持人的面部表情、肢體動作愈加豐富。驅(qū)動虛擬數(shù)字人面部表情、肢體動作的方式可分為兩類:一類是真人驅(qū)動,一類是智能驅(qū)動。由真人驅(qū)動的數(shù)字人,通過動作捕捉采集系統(tǒng)將真人表情、動作呈現(xiàn)在虛擬數(shù)字人身上。智能驅(qū)動類的數(shù)字人,通過智能系統(tǒng)讀取并解析外界輸入的信息后,能夠輸出相應結果驅(qū)動人物模型生成表情及動作。隨著技術的發(fā)展,驅(qū)動人物肢體運動時所綁定的骨骼、肌肉點會越來越多,虛擬主持人的非語言表達也會變得更加豐富。
友好的非語言線索會給受眾帶來更強的社會在場感。研究發(fā)現(xiàn),用戶在佩戴MR眼鏡與虛擬人進行交互時,虛擬人非語言符號表達的友好程度越高,越能夠增強用戶的社會在場感。Heerink等人在考察老年看護型機器人與老年人的感知社會在場感之間的關系時,發(fā)現(xiàn)隨著機器人直視、點頭、眨眼等行為增加,被試的感知社會在場感也會增加[8]。因此,在交互型虛擬主持人的設計中,可以增加對友好非語言行為的使用。
三、關系的發(fā)展:虛擬主持人與受眾間的交互
在經(jīng)歷了虛擬主持人與受眾關系的啟動階段后,如何使用戶在與虛擬數(shù)字人交互的過程中與之形成更緊密的關系?在關系的發(fā)展階段,與人際傳播相關的理論能為我們提供思考角度。
雖然真人主播、主持人所處的傳播情境具有多重性,但每種情境中都存在著人際交往。首先,在節(jié)目現(xiàn)場,主持人與現(xiàn)場嘉賓、觀眾等進行實時互動,形成人際傳播情境。其次,不在現(xiàn)場的受眾相對被動,主持人與受眾間形成大眾傳播情境。這一情境中,主持人與受眾雖缺乏面對面交流,但受眾仍會對主持人做出反應,并可能與其建立關系,甚至形成長期的情感紐帶。Horton和Wohl在研究中提出“準社會交往”的概念來解釋這一現(xiàn)象[9]。虛擬主持人同樣在上述多重傳播情境中進行著人際交互。
首先,由Baxter提出的關系的辯證法理論認為,在人際關系的發(fā)展過程中,人際間無時無刻不存在著矛盾的緊張狀態(tài)及對該狀態(tài)的協(xié)商,以保持人際關系中的平衡感[10]。“新奇感”與“可預測性”是該理論中的一對重要矛盾:新奇感表示人們期望體驗由改變帶來的刺激感,可預測性表示人們期望體驗由穩(wěn)定帶來的舒適感。虛擬數(shù)字人作為一個新的技術,人工智能的設計在具有創(chuàng)新性的同時,還需使用戶感受到可預測性及穩(wěn)定性。新奇感可以體現(xiàn)在虛擬數(shù)字人能突破人類生理極限,完成人類無法完成的事情。可預測性體現(xiàn)在人們對虛擬數(shù)字人的專業(yè)素養(yǎng)及道德要求等方面,因此在對虛擬主持人進行交互方面的設計時,需要考慮到受眾對與傳統(tǒng)主持人交往時的期待。
其次,社交媒體的使用也能促進虛擬主持人與受眾間關系的深入。在社交媒體中,隨著主持人自我表露程度的提升,人們對其有更深入的了解,兩者間的準社會關系也會更加緊密,社會在場感也會更高。Sundar發(fā)現(xiàn),社交媒體的技術可供性能夠激發(fā)有關可信度判斷的認知啟發(fā)[11]。新聞人使用社交媒體與關注者互動,會使關注者感知到他們在社交媒體上有更強的社會在場感,但社交媒體對于虛擬主持人來說可能是把雙刃劍。新聞人在使用社交媒體的過程中,關注者可能會對該新聞人的專業(yè)性產(chǎn)生負面看法。因此,虛擬主持人對在社交媒體上發(fā)布的內(nèi)容要進行精心挑選,避免負面印象的產(chǎn)生。
最后,當人類觀察到他人與虛擬主持人的互動時,也會增加其對虛擬人的感知在場感。有研究發(fā)現(xiàn),當人們觀察過真人與虛擬人以及虛擬人與虛擬人間的社會性討論與顯在的“相互社會在場”后,人們對實驗中的虛擬人類的感知社會存在感也提高了。因此,虛擬主持人在節(jié)目中與其他嘉賓的互動可能會正向影響受眾的感知社會在場感。
結語
技術的飛速發(fā)展為媒介內(nèi)容生產(chǎn)及形式創(chuàng)新不斷賦能,但我們同時要意識到技術水平的提升也可能帶來一些問題。有研究發(fā)現(xiàn),即使一些虛擬人外形十分逼真,但因其表達能力不足,最終仍得不到很好的反饋,反而是那些擬人化程度低,但善于表達的虛擬角色能獲得成功[12]。另外,當虛擬人有高度擬人化的形象時,用戶可能會提高對其的期待感,當現(xiàn)實與期待違背時,反而會降低其在場感。
虛擬數(shù)字人作為技術的產(chǎn)物,如何使其擁有“有趣的靈魂”一直是學界與業(yè)界關注的話題。目前AI技術還不足以支持虛擬主持人養(yǎng)成獨立行動及思想,需要經(jīng)過幕后團隊運營,才能讓數(shù)字人表現(xiàn)得更像“人”。但若運營不當,可能影響人們對虛擬數(shù)字人的看法。因此,廣電媒體除了在技術方向上不斷推動虛擬主持人的發(fā)展,也需通過發(fā)掘自身文化優(yōu)勢,賦予虛擬主持人強大的精神內(nèi)核。
注釋:
[1]喻國明.虛擬人、元宇宙與主流媒體發(fā)展的關鍵性操作要點[J].媒體融合新觀察,2022 (01): 4-8.
[2]程思琪, 喻國明, 楊嘉儀,? 陳雪嬌. 虛擬數(shù)字人:一種體驗性媒介——試析虛擬數(shù)字人的連接機制與媒介屬性[J].新聞界,2022(07): 12-23.
[3]Nass, C., & Moon, Y. (2000). Machines and mindlessness: Social responses to computers. Journal of social issues, 56(1), 81-103.
[4]Tomkins, S. S. (1978). Script theory: differential magnification of affects. Nebraska symposium on motivation.
[5]Lee, K. M. (2004). Presence, explicated. Communication theory, 14(1), 27-50.
[6]Lombard, M., & Jones, M. T. (2015). Defining presence. In Immersed in media (pp. 13-34). Springer.
[7]Kim, J., Merrill Jr, K., Xu, K., & Kelly, S. (2022). Perceived credibility of an AI instructor in online education: The role of social presence and voice features. Computers in Human Behavior, 136, 107383.
[8]Heerink, M., Kr?se, B., Evers, V., & Wielinga, B. (2010). Relating conversational expressiveness to social presence and acceptance of an assistive social robot. Virtual reality, 14(1), 77-84.
[9]Horton, D., & Richard Wohl, R. (1956). Mass communication and para-social interaction: Observations on intimacy at a distance. Psychiatry, 19(3), 215-229.
[10]Baxter, L. A. (1988). A dialectical perspective on communication strategies in relationship development.
[11]Sundar, S. S. (2008). The MAIN model: A heuristic approach to understanding technology effects on credibility. MacArthur Foundation Digital Media and Learning Initiative Cambridge, MA.
[12]Vinayagamoorthy, V., Gillies, M., Steed, A., Tanguy, E., Pan, X., Loscos, C., & Slater, M. (2006). Building expression into virtual characters.
(作者單位:河北大學新聞傳播學院)
責編:姚少寶