● 梅 凱 劉鳴箏
智能語音技術以智能語音設備為依托,目前主要有兩種存在方式:其一是嵌入手機或電腦之中,以手機或電腦等終端為依托,成為其功能的一部分,如蘋果公司的Siri、微軟電腦的Cortana、小米手機的小愛同學等。其二是獨立存在的智能設備,如智能音箱、翻譯機等。智能語音技術作為人工智能生態(tài)鏈中的關鍵一環(huán),其應用的場景愈發(fā)廣泛。筆者依據(jù)智能語音技術運作中的各環(huán)節(jié)要素,將智能語音技術的應用總結為:“三種模式”“多種應用”。
1.機器主導、用戶接收模式。此種模式是以機器作為語音信息發(fā)出者,用戶作為接收者的單程模式,主要涉及語言合成技術。用戶需要憑借搭載智能語音技術的智能設備接收信息,其與報紙、廣播和視頻等媒介的碰撞將會迸發(fā)出新樣式的傳播形態(tài)。
智能語音與報紙的結合將會促成有聲報紙的出現(xiàn)。有聲報紙是指區(qū)別于傳統(tǒng)紙質報紙僅單文本信息使用的新型報紙形態(tài),用戶只需調動聽覺即可進行信息消費。亞馬遜Alexa 語音助手面向用戶推出“新聞簡報”服務,用戶可根據(jù)需要詢問Alexa 即可獲取相關新聞信息。智能語音與廣播的融合導致AI 合成主播的誕生。廣播與智能語音技術有共同的組成元素——聲音。二者結合,一方面給播音員帶來了極大的職業(yè)危機;另一方面,智能語音技術的助力能夠減少廣播中的人為錯誤,給聽眾帶來全新的聽覺體驗。智能語音與視頻的結合促進視頻新聞的崛起。短視頻的興起使得人們信息接收形態(tài)產生了從單媒體到多媒體的轉變,智能語音技術能為音視頻自動翻譯匹配字幕,在給視頻產品生產提速的同時,也能更好地貼近用戶的信息消費喜好,更好地為用戶服務。
2.用戶主導、機器接收模式。這一模式是以用戶為中心,依據(jù)用戶不同需求和各自特點開展個性化服務,主要涉及語音識別技術。機器作為接收語音信息方,運用語音識別技術,將用戶發(fā)出的語音轉換成某種信號,機器接收后以其他非語言符號的形式反饋給用戶的模式。音頻搜索是伴隨著智能語音技術發(fā)展而成長起來的,是指用戶向智能語音設備口頭提問,設備接受指令后篩選音頻信息,并將這些搜索結果反饋給用戶的過程。聲紋識別適用于多主體發(fā)聲場景,聲紋和指紋一樣具有獨特性。智能語音技術依據(jù)這種獨特性,將不同發(fā)聲主體的聲音錄入系統(tǒng)中,久而久之形成該用戶特殊的語音新聞產品消費喜好。除此之外,聲紋識別還常用于會議場合。
3.人機交互模式。該模式是綜合了以上兩種應用場景而形成的一種更具現(xiàn)實意義的應用模式,用戶與機器之間類似于人際傳播面對面交流的場景。在智能家居領域,家用電器等產品之間物與物的相互連接和運轉需要一個調節(jié)和控制各物品的媒介,而智能音箱很好地扮演了這一角色。在醫(yī)療服務領域,科大訊飛在疫情期間推出“智能語音外呼助手”,協(xié)助疫情嚴重的省份做好人群的篩查與防控工作。
1.新聞采訪:策略性、準確性與時效性上的提升。在訪前策劃會中,運用智能語音中的聲紋識別技術可精準地記錄下每個人的發(fā)言內容,為后期的新聞寫作和編輯提供參考,防止新聞采寫過程中出現(xiàn)目的不明的問題。在采訪過程中,記者提問與受訪者的回答都能夠實時在智能語音設備中進行語音轉寫,在解放記者雙手的同時還促進了訪談的順利進行。同時,記者將整個采訪過程以錄音和文本的形式保存下來,便于記者在后期調查取證中以及消息寫作中靈活運用,增強了新聞的可信性和時效性。
2.新聞寫作:口語化與通俗化的轉變。在智能語音轉寫技術的幫助下,記者可在云端進行寫作。但智能語音技術可能會弱化原有新聞文本間的邊界。隨著智能語音技術的普及,記者和受訪者雙方以人際傳播的方式進行內容生產,語言成了雙方使用的首要媒介,這就使得智能語音技術轉寫的文本具有口語化和通俗化的特點。同時,新聞業(yè)一直存在“搶新聞”的現(xiàn)象,這迫使記者在新聞寫作過程中沒有太多時間斟酌文本內容。這樣生產出來的新聞產品會呈現(xiàn)出一種通俗的口語化傾向,在迎合用戶快速閱讀需要的同時,也增強了新聞的可讀性。
3.新聞編輯:記者與編輯職能一體化。智能語音技術在新聞編輯過程中緩解了記者的工作壓力。在智能語音技術的幫助下,記者編輯新聞時可根據(jù)不同的音頻節(jié)點準確找到需要修改的部分。與傳統(tǒng)的新聞編輯不同的是記者和編輯的職能分配發(fā)生了變化,二者間的邊界逐漸消融,出現(xiàn)了記者采訪、記者寫作、記者發(fā)稿的一套完整的新聞生產體系,從羅杰斯的創(chuàng)新擴散理論可以得出,新技術的普及和應用給原有的產業(yè)帶來變革的同時,也將他們更深層次地融合在一起。智能語音技術的普及和發(fā)展進一步提升了人們對新時期“全能記者”的期待。
4.新聞呈現(xiàn):新聞進入“可聽化”時代。與傳統(tǒng)純文本的文字閱讀相比,智能語音技術在新聞呈現(xiàn)階段促成了可聽化新聞的出現(xiàn)。早在2006 年就有媒體嘗試過“有聲新聞”,但是囿于技術原因,其發(fā)展不具有普遍性。如今,以智能音箱為代表的接收終端滲透率穩(wěn)步提升。智能音箱促生了“零用戶界面”語音信息接收的實現(xiàn),用戶聽覺感官的重要性也進一步得到了提升。
聲控智媒以便捷的操作方式、互動式的用戶體驗、強大的功能設計令消費者獲得了全新的體驗,同時也悄然催生著新聞傳媒業(yè)的變革。[1]一方面,智能語音技術在新聞生產中的應用給傳統(tǒng)新聞業(yè)的轉型以及記者素養(yǎng)的提升帶來了一線生機;另一方面,其變革的背后也充滿了重重挑戰(zhàn)。
1.記者:“記”的能力的“延伸”與“截除”。書寫文字的發(fā)明并非增進記憶與啟迪智慧,而是促使遺忘。[2]同理,記者憑借智能語音技術可直接將所說轉換成文本,后者也逐漸成為前者開展新聞工作的“親密搭檔”,記者手中的筆卻在逐漸消失。記者的“記”有書寫、記憶的意思。在新聞實際業(yè)務中,一名優(yōu)秀的記者不僅要能說會道而且要有扎實的文字功底。智能語音技術通過延伸記者部分感官功能(如耳聽和手寫)來協(xié)助記者工作,看似提高了新聞工作效率,減輕了記者的工作量,但實際上也逐漸削弱了記者耳聽手寫的能力。因此,若記者過分依賴智能語音技術,其立業(yè)之根“記”的能力便會逐漸“截除”,從而不利于全面發(fā)展。
2.新聞文本:口語化沖擊下的文本泛化。記者的采訪工作以人際傳播的形式展開,口語媒介的使用導致智能語音技術轉寫的材料呈現(xiàn)出具體事例多、抽象內容少,口語內容多、書面語言少的特點。其次,傳統(tǒng)的新聞記者在進行新聞寫作時,尤其是在進行通訊寫作時,往往對一個詞的使用反復推敲。但在智能語音輸入技術的支持下,記者與受訪者的對話往往是感性大于理性的,加之追求新聞時效性無法進一步完善新聞作品,最后的新聞產品質量與傳統(tǒng)的新聞產品相比可能會大打折扣。
以人為本,積極創(chuàng)新,才是新聞工作者面對新興技術應有的態(tài)度。智能語音技術雖然在收音、記錄和儲存等方面優(yōu)于人類,但是在個性化、思維能力等方面仍存在不足。因此,記者在智能語音面前要合理確認自身的角色,不能完全依賴智能設備。在采寫一般新聞消息時可合理運用智能語音設備,但在采寫重要的特殊的新聞時則要積極動用多感官,進一步地鍛煉“腳力”、抬升“眼力”、提升“腦力”、拔高“筆力”。人機互助,各取所長。同時,智能語音技術的應用促成新聞文本的泛化,記者在面對這一問題時,既要繼承好已有的新聞文本,又要與借助智能語音技術產生的新聞泛化文本結合起來。傳統(tǒng)的通訊和評論是兩大較復雜的新聞文體,具有很強的獨特性。智能語音技術在這方面的能力相對欠缺,但智能語音技術在傳播語態(tài)的通俗化和口語化方面具有天然優(yōu)勢。記者應在繼承既有文本的基礎上,對技術生成的新內容進行綜合運用,給新聞文本注入新的活力,不斷滿足用戶在新的媒介環(huán)境下的信息消費需求。在智能語音等人工智能技術的助力下,未來新聞生產領域的分工邊界將逐漸消失,而記者的身影將會出現(xiàn)在新聞生產流程的各個階段,這也促成了新媒體時代“全能記者”的誕生。