楊春輝
(河北傳媒學院,河北 石家莊 050000)
AI語音技術的發(fā)展,促使人工智能與播音主持在傳媒領域擦出新的火花。AI合成主播作為人工智能與播音主持融合的技術產(chǎn)品,其功能的發(fā)揮,在一定程度上不僅將真實的播音員主持人從繁重的勞動中解脫出來,也滿足了受眾的收視需求。但是,AI主播的功用目前只是停留在有稿播音層面,其在未來的發(fā)展中還存在很大的空間。
人工智能在傳媒業(yè)的探索過程中不斷取得新的突破,AI合成主播的推出與優(yōu)化升級便是最好的證明?!癆I合成主播”主要是從聲音和圖像這兩個層次進行研發(fā)建構,通過提取真實播音員在進行新聞播報時的有聲語言及副語言表達的特征,運用語音、唇形、表情合成等技術構建AI主播。例如,全球首個AI合成女主播“新小萌”,其聲音與形象脫胎于新華社新聞主播屈萌。
目前,AI合成主播主要應用于新聞播報。2018年11月,搜狗公司與新華社聯(lián)合發(fā)布以新華社新聞主播邱浩為原型的全球首個“AI合成主播”;2019年2月,升級為站立式AI合成主播“新小浩”,同日發(fā)布全球首個AI合成女主播“新小萌”在今年兩會時上崗。AI合成主播自在新華社平臺上崗以來,參與了2019年春運、春節(jié)、兩會等重要事件的新聞報道,已播報新聞上千余篇。
2019年兩會期間,全球首個人工智能多語種虛擬主播“小晴”上崗,通過中、英、韓、日等多語種進行兩會新聞報道。在2019年3·15晚會預熱新媒體直播中,央視財經(jīng)聯(lián)合搜狗推出以央視主持人姚雪松為原型的AI主播“姚小松”,為大家播報關于315晚會的重要消息。
AI合成主播的研發(fā),主要是使語音合成和圖像生成這些特定的程序能夠生成如同真實的播音員主持人一樣的智能產(chǎn)品,具備主持人的功能和作用,高效完成節(jié)目制作,實現(xiàn)對受眾的精準化服務。
AI合成主播隨時在崗是它的一大優(yōu)勢,它可以全天候24小時為官方網(wǎng)絡以及社交媒體平臺工作,對于夜間的新聞播報也能夠以積極的狀態(tài)進行,在一定程度上分化了真實播音員的勞動,極大地減輕了真實主持人的工作任務。例如,在新華社客戶端中,3月3日的最后一條新聞是在夜間23:04:24發(fā)布的,3月5日的第一條新聞是在凌晨00:52:22發(fā)布的,AI主播的播講狀態(tài)始終積極。
AI合成主播能夠進行新聞播報是建立在數(shù)據(jù)庫的基礎之上,通過語音識別、語音合成、人臉識別、人臉建模等技術完成的。例如,新華社AI合成主播“新小浩”正是通過多項人工智能技術,將真實主持人邱浩“復制”出來,呈現(xiàn)出AI合成主播與真實播音員的語音和形象極度相似的新聞播出效果。人對AI合成主播輸入所需播報的文本數(shù)據(jù),AI合成主播即可實時完成新聞信息的播報并生成視頻,極大地提升了電視新聞的制作效率,使新聞時效性更強、信息傳遞也更及時準確。
AI語音背景下,AI合成主播、虛擬主持人、智能機器主持人等新興傳播載體的誕生及應用,推動中國電視傳媒產(chǎn)業(yè)在數(shù)字化信息交互平臺的發(fā)展,極大地豐富了電視節(jié)目的傳播手段。尤其是信息傳播技術的飛速發(fā)展,信息資源的全球性流通與共享,促使中國電視傳媒產(chǎn)業(yè)實現(xiàn)全球性的傳播與發(fā)展。
2019年兩會期間,由科大訊飛推出的全球首個人工智能多語種虛擬主播“小晴”上崗,依托機器翻譯技術進行多國語言翻譯,可以使用中、英、韓、日等多語種進行兩會新聞報道,實現(xiàn)一個聲音多語種播報。同時,多語種AI虛擬主播“小晴”的多語種播報,更是在第一時間將中國兩會期間的新聞信息對外傳遞,加大了信息世界化的傳播力度,加強了中國電視對外傳播的交流力度。
在高科技競爭日益激烈的情況下,AI合成主播的頻繁使用與不斷優(yōu)化升級,意味著中國電視的傳播媒介取得了新的進展,這也是全球傳播大發(fā)展中,中國電視新聞信息傳播的新機遇。
人工智能技術在傳媒領域所應用的功能,是屬于程序性的、無需人發(fā)揮的信息傳輸功能,其語音輸出及視頻輸出是基于大數(shù)據(jù)的輸入由數(shù)據(jù)庫自動生成的。AI在廣播電視領域的應用,目前主要應用于廣播電視節(jié)目中較為規(guī)整的、無變化的、簡單的播音主持創(chuàng)作活動。
AI合成主播是基于人工智能技術而產(chǎn)生的一種新的電視節(jié)目傳播載體,是完全依賴于技術的“電視播音員”,其語音輸出、面部表情、肢體動作等都是按照人所設定的程序及發(fā)出的指令行事。AI合成主播主要應用于新聞播報,屬于較為簡單、規(guī)整的新聞稿件的語音及圖像輸出,它在接收到新聞稿件的文本數(shù)據(jù)后即可程序性的輸出音頻和視頻數(shù)據(jù),無需人的發(fā)揮。從某種意義上來說,AI合成主播是一種把人們從繁重的勞動中解脫出來的工具。
目前,我國的人工智能技術雖在語音及圖像處理方面取得較大突破,但讓AI合成主播能夠自如呈現(xiàn),使其語音功能和虛擬形象如同真實播音員一樣自然和諧,仍然有待提高。
語流音變是我們在連續(xù)說話時產(chǎn)生的現(xiàn)象。在語流中,相鄰的音節(jié)會受到影響,讀音發(fā)生變化就是語流音變[1]。在普通話中較為典型的語流音變是變調、輕聲、兒化的變化。如果連續(xù)說話時,只是把每一個音節(jié)的音讀準確,而未改變組合音節(jié)的發(fā)音,是不符合音變規(guī)律的,更難以使語音自然和諧。
AI合成主播的語音是多音節(jié)的連續(xù)輸出,相對于人的自然語音機械性較強,缺乏語流音變。例如,2019年3月6日,在新華社客戶端“新小浩上兩會”專欄中,AI合成主播“新小浩”在播報“又見直播‘利器’”這則新聞時,將“什么東西最難攜帶?什么東西最沉最累人?”這句話中的“東西”二字均讀為陰平,并未進行音變處理。“東西”在指方位時不發(fā)生音變,但在形容具體的事、物時,其第二個音節(jié)“西”應讀輕聲。長此以往,容易引起人們發(fā)音上的混淆,對人們產(chǎn)生誤導。
在有聲語言的表達中,停頓是聲音中斷、休止的地方[2]。播音員主持人在進行備稿時要通讀全文,了解全文語句的句法、結構及語句的意思,根據(jù)語義確定停頓的位置。語句的意義完成,聲音才能停頓。如若停頓位置錯誤,就會使語義發(fā)生變化,促使語義不明,甚至導致對文本的誤讀。
文稿中有單句和復句,對于復句的處理要從語義著手,根據(jù)語句之間的邏輯關系確定停頓的位置。目前,AI合成主播難以通過分析語句結構準確找到停頓的位置。例如,在新華社客戶端“新小浩上兩會”專欄中,“新小浩”在2019年3月9日的新聞報道中讀到“邀請全國人大環(huán)境與資源保護委員會委員程立峰等就‘人大立法工作’相關問題回答記者提問”這句話時,在“環(huán)境”后面做了停頓。通過分析語句得知“全國人大環(huán)境與資源保護委員會”是一個機構,這種專有名詞不能在中間做停頓處理。
廣播電視有聲語言的傳播分為兩種,一種是表達語言的表層意思,另一種則為語言的深層含義,即通過語言還能了解為什么[3]。目前,AI合成主播還處于傳遞表層信息的階段,不能做到“言志傳神”。播音員主持人在進行文稿的再創(chuàng)作時,不能僅僅停留在文字表面,文字是具有表情、表意方面的多向性的,要把握播講目的。不同的新聞稿件有不同的背景,主播要充分理解,運用與之相對應的情感基調進行報道。AI主播的情感基調是固定的,難以通過語音表達文字的深層含義。
在播音創(chuàng)作中,理解稿件需要從內容和形式兩方面深入分析。新聞分為消息、評論、通訊等不同形式,播音員針對不同體裁的稿件要運用與之相對應的話語樣式。AI主播的語音播報是從文本內容出發(fā),而忽略了稿件的形式,難以正確地傳播稿件內容。真實播音員的播音創(chuàng)作是一種有意識、有目的的社會實踐,而AI主播屬于機器,無法傳達特定語境下文字所蘊含的深層內涵。
人工智能時代背景下,AI合成主播成為電視新聞信息傳播的載體,在一定程度上確實起到了真實播音員的傳播作用。目前,AI合成主播的語音功能相較于人的自然語音具有一定的優(yōu)劣性,難以完全起到主持傳播的作用,唯有不斷提升人工智能技術,才能使得AI合成主播獲得持續(xù)不斷的發(fā)展動力。