王曉雪
(中國(guó)石油報(bào)社,北京 100011)
隨著技術(shù)的不斷進(jìn)步,人工智能(Artificial Intelligence,AI)和語(yǔ)音識(shí)別技術(shù)在新聞行業(yè)發(fā)揮越來(lái)越重要的作用。尤其是新聞采訪和訪談,相較過(guò)去,不僅效率有了極大的提高,而且質(zhì)量得到了大幅提升。AI 和語(yǔ)音識(shí)別技術(shù)的應(yīng)用,拓寬了新聞采訪和訪談的工作邊界,讓新聞采訪和訪談更加智慧化。
AI 指機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語(yǔ)言處理及計(jì)算機(jī)視覺(jué)等一系列技術(shù)和算法的綜合應(yīng)用。通過(guò)這些技術(shù)和算法,計(jì)算機(jī)可以模擬人類(lèi)的智能行為。語(yǔ)音識(shí)別技術(shù)指將人類(lèi)語(yǔ)音轉(zhuǎn)換為計(jì)算機(jī)可處理的文本形式的技術(shù),是自然語(yǔ)言處理的重要組成部分。
AI 和語(yǔ)音識(shí)別技術(shù)在新聞采訪和訪談中應(yīng)用的優(yōu)勢(shì)主要體現(xiàn)在4 個(gè)方面。第一,提高效率,可以實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)和文本摘要,大大提高了采訪和訪談的效率。第二,增加可訪問(wèn)性,可以幫助聽(tīng)覺(jué)障礙人士通過(guò)文字轉(zhuǎn)寫(xiě)來(lái)獲取訪談內(nèi)容,從而增加他們對(duì)新聞報(bào)道的了解和參與。第三,降低成本,可以替代繁重的人工工作,以此降低人力成本[1]。第四,數(shù)據(jù)挖掘和分析,可以發(fā)現(xiàn)隱藏的模式、趨勢(shì),能更好地了解受眾需求,提供更加精準(zhǔn)和個(gè)性化的新聞報(bào)道[2]。
AI 和語(yǔ)音識(shí)別技術(shù)在新聞采訪和訪談中的關(guān)鍵應(yīng)用主要是指智能問(wèn)答和交互系統(tǒng),主要采用了語(yǔ)音識(shí)別技術(shù)、自然語(yǔ)言處理技術(shù)以及機(jī)器學(xué)習(xí)算法等技術(shù),作用是使人與機(jī)器通過(guò)提問(wèn)、回答、互動(dòng)的方式進(jìn)行信息交流和溝通。文章后續(xù)將基于智能問(wèn)答和交互系統(tǒng),分別對(duì)3 種技術(shù)在新聞采訪和訪談中的應(yīng)用進(jìn)行闡述。智能問(wèn)答和交互系統(tǒng)的實(shí)現(xiàn)過(guò)程如圖1 所示。
圖1 智能問(wèn)答和交互系統(tǒng)的實(shí)現(xiàn)過(guò)程流程圖
3.1.1 語(yǔ)音識(shí)別技術(shù)的基本原理
語(yǔ)音識(shí)別技術(shù)的基本工作過(guò)程主要有6個(gè)步驟。第一,音頻錄制。首先使用麥克風(fēng)或其他音頻設(shè)備錄制待識(shí)別的語(yǔ)音,將語(yǔ)音信號(hào)轉(zhuǎn)化為數(shù)字音頻數(shù)據(jù)。第二,預(yù)處理。對(duì)錄制的語(yǔ)音信號(hào)進(jìn)行預(yù)處理,主要是針對(duì)語(yǔ)音信號(hào)進(jìn)行去噪、增強(qiáng)等操作,通過(guò)這些操作提高識(shí)別的準(zhǔn)確性。第三,特征提取。根據(jù)語(yǔ)音信號(hào)的時(shí)域和頻域特征,通過(guò)梅爾頻率倒譜系數(shù)、線性預(yù)測(cè)編碼等方法提取出能夠表征語(yǔ)音的特征向量。第四,聲學(xué)模型訓(xùn)練。將特征向量與對(duì)應(yīng)的文本標(biāo)注進(jìn)行配對(duì),并構(gòu)建訓(xùn)練數(shù)據(jù)集。然后對(duì)聲學(xué)模型進(jìn)行訓(xùn)練,學(xué)習(xí)語(yǔ)音特征與文本之間的關(guān)聯(lián)。第五,語(yǔ)音識(shí)別。將待識(shí)別的語(yǔ)音信號(hào)進(jìn)行預(yù)處理和特征提取,通過(guò)聲學(xué)模型將特征向量映射為概率分布序列。使用語(yǔ)言模型計(jì)算各個(gè)可能的文本序列的概率,并通過(guò)搜索算法找到最有可能的文本序列作為識(shí)別結(jié)果。第六,后期處理。主要針對(duì)語(yǔ)音識(shí)別結(jié)果進(jìn)行錯(cuò)誤修正、斷句分詞等操作。
3.1.2 語(yǔ)音識(shí)別技術(shù)在新聞采訪中的具體應(yīng)用
在新聞采訪中,智能問(wèn)答和交互系統(tǒng)是當(dāng)前十分新穎的應(yīng)用,語(yǔ)音識(shí)別技術(shù)在該應(yīng)用中的作用十分關(guān)鍵。在新聞采訪智能問(wèn)答和交互系統(tǒng)的使用過(guò)程中,語(yǔ)音識(shí)別技術(shù)主要支持語(yǔ)音提問(wèn),用戶可以通過(guò)語(yǔ)音向智能系統(tǒng)提出問(wèn)題,無(wú)須輸入文字,方便快捷。同時(shí)支持語(yǔ)音回答,智能系統(tǒng)可以通過(guò)語(yǔ)音生成技術(shù)將回答轉(zhuǎn)化為語(yǔ)音,以口頭形式回復(fù)用戶的問(wèn)題。語(yǔ)音識(shí)別技術(shù)還可以實(shí)現(xiàn)多輪對(duì)話,用戶可以通過(guò)語(yǔ)音進(jìn)行連續(xù)的提問(wèn)和回答,實(shí)現(xiàn)更自然、流暢的交互體驗(yàn)。語(yǔ)音識(shí)別技術(shù)還可以通過(guò)用戶發(fā)出的語(yǔ)音指令來(lái)控制智能系統(tǒng)的操作,如播放音樂(lè)、調(diào)整音量、發(fā)送消息等。除此之外,該系統(tǒng)能通過(guò)語(yǔ)音識(shí)別技術(shù)根據(jù)用戶的語(yǔ)音指令和回答內(nèi)容,提供個(gè)性化的服務(wù)和建議,如推薦電影、點(diǎn)播音樂(lè)等。在新聞采訪過(guò)程中,語(yǔ)音識(shí)別技術(shù)可以分析用戶的語(yǔ)音特征,識(shí)別情感狀態(tài),并據(jù)此進(jìn)行相應(yīng)的回應(yīng)或建議,改善用戶體驗(yàn)。
3.2.1 自然語(yǔ)言處理技術(shù)的基本原理
自然語(yǔ)言處理技術(shù)的基本工作原理主要分為基礎(chǔ)任務(wù)、復(fù)雜任務(wù)兩類(lèi)?;A(chǔ)任務(wù)主要包括分詞、詞性標(biāo)注及句法分析3 個(gè)功能。分詞主要是將文本劃分為單個(gè)的詞或標(biāo)記,形成詞匯單位;詞性標(biāo)注主要是確定每個(gè)詞在上下文中的詞性,句法分析主要是確定句子中各個(gè)詞之間的語(yǔ)法關(guān)系。復(fù)雜任務(wù)主要包括語(yǔ)義分析、情感分析、實(shí)體關(guān)系抽取、機(jī)器翻譯及文本生成這5 個(gè)功能。語(yǔ)義分析指理解句子的意義和語(yǔ)義關(guān)系,情感分析指識(shí)別文本中的情感傾向,如正面、負(fù)面、中性等;實(shí)體關(guān)系抽取是指從文本中提取出實(shí)體之間的關(guān)系,機(jī)器翻譯指基于相關(guān)模型或語(yǔ)言資料庫(kù)的訓(xùn)練,將一種語(yǔ)言的文本自動(dòng)翻譯成另一種語(yǔ)言的文本[3]。
3.2.2 自然語(yǔ)言處理技術(shù)在新聞訪談中的具體應(yīng)用
在新聞訪談中,自然語(yǔ)言處理技術(shù)同樣是智能問(wèn)答和交互系統(tǒng)的關(guān)鍵技術(shù)。在智能問(wèn)答和交互過(guò)程中,自然語(yǔ)言處理技術(shù)能夠幫助系統(tǒng)理解被采訪者的問(wèn)題,并識(shí)別其中的語(yǔ)義和意圖,有助于更好地理解被采訪者的觀點(diǎn)和立場(chǎng),推動(dòng)對(duì)話的深入交流。自然語(yǔ)言處理技術(shù)可以實(shí)現(xiàn)在采訪過(guò)程中抽取關(guān)鍵信息,進(jìn)行總結(jié),大大提高了采訪過(guò)程的效率。自然語(yǔ)言處理技術(shù)還可以進(jìn)行情感分析。這里的情感分析與語(yǔ)音識(shí)別的情感分析存在區(qū)別。自然語(yǔ)言處理是將被采訪者的語(yǔ)音轉(zhuǎn)變成文字,通過(guò)文字進(jìn)行情感分析,有助于探測(cè)被采訪者回答中的情感傾向,了解其態(tài)度和情緒。除此之外,自然語(yǔ)言處理技術(shù)可以對(duì)采訪過(guò)程的語(yǔ)音進(jìn)行實(shí)時(shí)翻譯,并生成相關(guān)的字幕,輔助在采訪過(guò)程中進(jìn)行針對(duì)性提問(wèn)。
3.3.1 機(jī)器學(xué)習(xí)算法的基本原理
機(jī)器學(xué)習(xí)算法的基本工作主要分為5 個(gè)步驟。第一,數(shù)據(jù)收集和預(yù)處理,收集和準(zhǔn)備用于訓(xùn)練算法的數(shù)據(jù)。第二,特征選擇和提取。在機(jī)器學(xué)習(xí)中,數(shù)據(jù)通常包含多個(gè)特征或?qū)傩?。特征選擇和提取的目標(biāo)是從原始數(shù)據(jù)中選擇最相關(guān)的特征,或通過(guò)轉(zhuǎn)換和組合特征來(lái)提取更有信息量的特征。第三,模型選擇和訓(xùn)練。根據(jù)問(wèn)題的性質(zhì)和數(shù)據(jù)的特點(diǎn),利用線性回歸、決策樹(shù)、支持向量機(jī)及神經(jīng)網(wǎng)絡(luò)等模型,通過(guò)訓(xùn)練數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,使其能夠正確預(yù)測(cè)或分類(lèi)輸入數(shù)據(jù)。第四,模型評(píng)估和調(diào)優(yōu)。使用測(cè)試數(shù)據(jù)集對(duì)訓(xùn)練好的模型進(jìn)行評(píng)估,以了解其在未知數(shù)據(jù)上的性能表現(xiàn)。如果模型的性能不理想,可以通過(guò)調(diào)整模型的參數(shù)或改進(jìn)特征工程等方式進(jìn)行優(yōu)化。第五,模型應(yīng)用和預(yù)測(cè)。將模型應(yīng)用于實(shí)際問(wèn)題,給定新的輸入數(shù)據(jù),模型可以生成相應(yīng)的預(yù)測(cè)結(jié)果或分類(lèi)結(jié)果[4]。
3.3.2 機(jī)器學(xué)習(xí)算法在新聞采訪和訪談中的具體應(yīng)用
無(wú)論是在新聞采訪還是訪談過(guò)程中,智能問(wèn)答和交互系統(tǒng)的核心技術(shù)都是機(jī)器學(xué)習(xí)算法。機(jī)器學(xué)習(xí)算法通過(guò)大量的語(yǔ)言數(shù)據(jù)進(jìn)行學(xué)習(xí)和訓(xùn)練,使得智能問(wèn)答和交互系統(tǒng)可以快速、自動(dòng)地回復(fù)用戶的問(wèn)題。這個(gè)回答不是簡(jiǎn)單的回答,而是經(jīng)過(guò)語(yǔ)言模型深度學(xué)習(xí)、經(jīng)過(guò)思考后的回答,最終通過(guò)語(yǔ)音識(shí)別技術(shù)把回答內(nèi)容用語(yǔ)言表達(dá)出來(lái)。不僅如此,它也可以用于情感分析。這里的情感分析與語(yǔ)音識(shí)別技術(shù)、自然語(yǔ)言處理技術(shù)的情感分析不同,智能問(wèn)答和交互系統(tǒng)可以根據(jù)被采訪者的態(tài)度和情緒,及時(shí)、智能地調(diào)整溝通提問(wèn)的方式,提出的問(wèn)題也會(huì)變得更加深入[5]。
2019 年兩會(huì)期間,中國(guó)日?qǐng)?bào)社聯(lián)合百度公司開(kāi)發(fā)了一款名為“智能記者”的AI 機(jī)器人,可以通過(guò)語(yǔ)音識(shí)別、自然語(yǔ)言處理和智能問(wèn)答等技術(shù),實(shí)現(xiàn)對(duì)代表的自動(dòng)采訪?!爸悄苡浾摺笨梢宰詣?dòng)化地提問(wèn)、記錄、生成文本和摘要等,大大減輕了記者的工作負(fù)擔(dān),節(jié)省了采訪時(shí)間。
AI 和語(yǔ)音識(shí)別技術(shù)在新聞采訪和訪談中的應(yīng)用具有廣闊的發(fā)展前景。未來(lái)的語(yǔ)音識(shí)別技術(shù)將更加注重理解和推斷訪談內(nèi)容的語(yǔ)義。它們將能夠更準(zhǔn)確地識(shí)別并理解說(shuō)話者的意圖、情感和上下文,從而提供更深入和全面的訪談結(jié)果。隨著語(yǔ)音識(shí)別技術(shù)的廣泛應(yīng)用,隱私保護(hù)和安全性將成為關(guān)注的焦點(diǎn),未來(lái)還將注重確保訪談內(nèi)容的安全傳輸和存儲(chǔ),以及對(duì)用戶個(gè)人信息的保護(hù)。AI 與語(yǔ)音識(shí)別技術(shù)在新聞采訪和訪談中的應(yīng)用在未來(lái)的發(fā)展具有潛力,將為新聞業(yè)帶來(lái)更多創(chuàng)新和發(fā)展。
隨著AI 與語(yǔ)音識(shí)別技術(shù)的不斷發(fā)展和進(jìn)步,新聞采訪和訪談將迎來(lái)更多創(chuàng)新應(yīng)用。這些應(yīng)用會(huì)使得新聞報(bào)道更加高效、準(zhǔn)確和智能化,進(jìn)一步推動(dòng)新聞行業(yè)的智慧化發(fā)展。