◎胡樂煒 王 源
2020年,一場突如其來的新冠肺炎使得全世界各國的經(jīng)濟(jì)遭受了巨大打擊。為了有效應(yīng)對疫情沖擊,拉動經(jīng)濟(jì)的增長,我國首次將新基建政策寫入政府工作報(bào)告,通過建立5G基站、大數(shù)據(jù)中心、人工智能等新型基礎(chǔ)設(shè)施,為各行業(yè)發(fā)展注入數(shù)字動力。人工智能不再僅僅是存在于電影小說中的科技前沿,而是被國家列入新基建的七大核心領(lǐng)域之一的重點(diǎn)技術(shù)。新聞媒體行業(yè)的信息傳播和文字編輯屬性,使得人工智能在該行業(yè)的廣泛應(yīng)用融合有著廣闊的前景,本文將結(jié)合人工智能在新聞媒體行業(yè)的應(yīng)用現(xiàn)狀,探析該行業(yè)新業(yè)態(tài)的發(fā)展態(tài)勢。
1.人工智能的概念
簡單來說,人工智能(Artificial Intelligence)是計(jì)算機(jī)科學(xué)的一個技術(shù)分支,用來構(gòu)建能夠執(zhí)行通常需要人類智能的高階算法。
人工智能可以劃分為兩大類,包括狹義人工智能(Narrow AI)和廣義人工智能(General AI)。狹義的人工智包括當(dāng)今在計(jì)算機(jī)程序算法中隨處可見的應(yīng)用范式,即在沒有明確程序規(guī)則的情況下,學(xué)會如何執(zhí)行特定任務(wù)的智能系統(tǒng)。
這種人工智能在智能手機(jī)虛擬助手的語音識別、自動駕駛汽車上的視覺識別系統(tǒng)、以及根據(jù)用戶過去購買過的產(chǎn)品推薦引擎中應(yīng)用得很廣泛。然而,與人類不同,這些系統(tǒng)被局限在需要被教授如何做特定的單一任務(wù)。
廣義人工智能則非常不同,它是人類創(chuàng)建的適應(yīng)性智力類型,展現(xiàn)為一種靈活的智力形式,能夠?qū)W習(xí)如何執(zhí)行截然不同的任務(wù),例如,從理發(fā)到編輯文字,或者根據(jù)其積累的經(jīng)驗(yàn),推理各種各樣的主題。時至今日還并未真正實(shí)現(xiàn)。
2.人工智能的主要研究方向
當(dāng)前,針對人工智能的研究囊括大量的研究議題,并且,其中有很多研究方向互為補(bǔ)充。機(jī)器學(xué)習(xí)是人工智能(Machine Learning)的一個很重要的研究方向。在機(jī)器學(xué)習(xí)的過程是通過向計(jì)算機(jī)系統(tǒng)輸入大量數(shù)據(jù),然后用這些數(shù)據(jù)學(xué)習(xí)如何執(zhí)行特定任務(wù)。在機(jī)器學(xué)習(xí)過程中,最為關(guān)鍵的是通過一定的算法構(gòu)造神經(jīng)網(wǎng)絡(luò)(Neural Network)。神經(jīng)網(wǎng)絡(luò)中存在很多層次,由相互傳遞數(shù)據(jù)的節(jié)點(diǎn)(稱為神經(jīng)元)連接,它們通過在各層之間傳遞輸入數(shù)據(jù)時調(diào)整輸入數(shù)據(jù)的權(quán)值來完成特定的任務(wù)。在訓(xùn)練這些神經(jīng)網(wǎng)絡(luò)的過程中,附加到不同輸入的權(quán)值將會持續(xù)變化,直到神經(jīng)網(wǎng)絡(luò)的輸出非常接近期望的值,此時網(wǎng)絡(luò)將“學(xué)會”如何執(zhí)行特定的任務(wù)。神經(jīng)網(wǎng)絡(luò)的類型多種多樣,各有優(yōu)缺點(diǎn)。例如,遞歸神經(jīng)網(wǎng)絡(luò)是一種特別適合于語言處理和語音識別的神經(jīng)網(wǎng)絡(luò),而卷積神經(jīng)網(wǎng)絡(luò)更常用于圖像識別。
人工智能研究的另一個重要分支是自然語言處理(NaturalLanguage Processing)。自然語言處理的目標(biāo)是使機(jī)器能以一種特定的方式閱讀、破譯、理解人類語言。其任務(wù)在于將人類語言分解成更短、更基本的部分,理解這些部分之間的關(guān)系,探索這些部分是如何組合起來產(chǎn)生意義的。在自然語言處理中,機(jī)器學(xué)習(xí)算法可以幫助訓(xùn)練已經(jīng)被人類標(biāo)記的成千上萬的文本樣本,單詞,句子和段落。通過研究這些例子,機(jī)器將獲得對人類語言上下文的一般理解,并基于這些知識來分析未來的文本。具體來說,自然語言處理包含文本分類、主題發(fā)現(xiàn)和建模、上下文提取、語義分析、文本概括等基本任務(wù)。
此外,進(jìn)化計(jì)算(Evolutionary Computation)也是人工智能重要的研究方向。它借鑒了達(dá)爾文的自然選擇理論,認(rèn)為遺傳算法會在兩代人之間進(jìn)行隨機(jī)突變和組合,而不斷嘗試優(yōu)化給定問題的最優(yōu)解。進(jìn)化計(jì)算的相關(guān)研究主要用來幫助設(shè)計(jì)人工智能模型,以有效地迭代提升人工智能程度。利用進(jìn)化算法優(yōu)化神經(jīng)網(wǎng)絡(luò)被稱為神經(jīng)進(jìn)化,隨著智能系統(tǒng)的使用變得越來越普遍,特別是在對數(shù)據(jù)科學(xué)家的需求經(jīng)常超過供給的情況下,進(jìn)化算法在幫助設(shè)計(jì)高效人工智能方面發(fā)揮重要作用。
新興數(shù)字化技術(shù)不斷涌現(xiàn)總是推動著新聞媒體行業(yè)的重構(gòu)。在過去的十幾年里,由于智能終端、無線互聯(lián)網(wǎng)的快速發(fā)展和成熟,催生了各種以電子雜志、有聲讀物等代表的商業(yè)模式?,F(xiàn)今,人工智能技術(shù)又悄然融入新聞媒體行業(yè)發(fā)展的軌道之中,從中誕生出新的業(yè)態(tài)。
1.智能寫作
智能寫作也稱為機(jī)器寫作(Machine Writing),他基于經(jīng)過訓(xùn)練形成的寫作模板,利用自然語言處理技術(shù),從海量的本文中抽取精確的語料進(jìn)行加工處理,實(shí)現(xiàn)新聞的自動生成。由于智能寫作的及時性和便捷性,已經(jīng)在國內(nèi)外的新聞媒體行業(yè)的得到廣泛應(yīng)用。例如:美聯(lián)社采用Wordsmith寫稿機(jī)器人后,每季度撰寫的財(cái)經(jīng)簡報(bào)數(shù)量由原來的三百篇猛升至四千多篇;騰訊研發(fā)的DreamWriter能夠瞬間輸出分析和研判,一分鐘之內(nèi)將重要資訊和解讀送達(dá);快筆小新機(jī)器人有能力在紛繁冗雜的數(shù)據(jù)中,迅速采集整理,準(zhǔn)確為新華社編寫新聞稿件。然而,機(jī)器人寫稿盡管能夠輔助編輯精確定位信息,快速撰寫簡報(bào),但在推理、抽象等能力上還遠(yuǎn)遠(yuǎn)不能替代人類,因此目前的寫作類型局限在數(shù)據(jù)繁雜且強(qiáng)調(diào)時效性的財(cái)經(jīng)類和體育類等方面。
2.智能編輯
智能編輯(AI Editor)幫助新聞媒體行業(yè)在多屏?xí)r代的大數(shù)據(jù)環(huán)境下對于新聞進(jìn)行有效的分類和管理。每天,用戶都可以通過各種智能終端接收新聞信息,發(fā)表評論意見,如何從海量新聞數(shù)據(jù)中找到最有價值的新聞,并進(jìn)行有效推送,以及如何識別和屏蔽不良和虛假信息是智能編輯的職責(zé),支撐其的人工智能技術(shù)也一直不斷在演化改進(jìn)。一方面,新聞媒體企業(yè)實(shí)時采集用戶的行為數(shù)據(jù)(例如:瀏覽時長、點(diǎn)贊數(shù)、關(guān)注用戶等),利用機(jī)器學(xué)習(xí)算法發(fā)現(xiàn)隱藏模式,為每位用戶所關(guān)注的新聞重要性進(jìn)行排序,提供個性化推薦。另一方面,AI編輯能夠從人工生成的數(shù)據(jù)中識別真實(shí)數(shù)據(jù)源和真實(shí)新聞內(nèi)容的模式。這些機(jī)器學(xué)習(xí)系統(tǒng)可以作為第一遍編輯控制,可以根據(jù)其他來源驗(yàn)證新聞項(xiàng)目,自動提供來自第三方來源的驗(yàn)證,并進(jìn)一步幫助加強(qiáng)真實(shí)新聞故事或揭穿錯誤。新聞聚合器可以自動輸入真相檢查鏈接和來源,并對入站新聞報(bào)道進(jìn)行真實(shí)的可能性評分。Facebook很早就開始采用NewsFeed為用戶推送感興趣的新聞,泰晤士報(bào)也在使用James智能編輯,收集的用戶數(shù)據(jù),為他們精準(zhǔn)“投喂”新聞內(nèi)容。在國內(nèi),今日頭條的AI編輯通過輸入的新聞(如:圖文、視頻、問答、微頭條等),用戶(如:興趣標(biāo)簽、職業(yè)、年齡、機(jī)型等),場景(如:工作、休息、旅游等)三個維度的信息來篩選合適的新聞內(nèi)容推送給特定用戶。
3.AI主播
AI主播也稱為AI合成主播,是以真實(shí)的主持人為原型,利用虛擬圖像、語音識別、深度學(xué)習(xí)等人工智能技術(shù)捕捉真人海量數(shù)據(jù)所形成的。當(dāng)輸入新聞文本數(shù)據(jù),AI主播就能夠擬人化地形成一段新聞播報(bào)視頻。2018年,新華社聯(lián)合搜狗在互聯(lián)網(wǎng)大會上發(fā)布了首位AI主播-----新小浩(以新華社記者邱浩為原型),隨后又在重大的活動中不斷推出新的AI主播(例如:新小萌、小小撒、新小微等)上崗主持播報(bào),這些近似真人的AI主播不知疲倦地播報(bào)新聞,不僅在表情神態(tài)上以假亂真,而且極大提升了稿件播報(bào)的準(zhǔn)確性和新聞的傳播效率。然而,目前的AI主播普遍還只能表達(dá)新聞稿件的字面意義,無法傳遞出文字本后的情感。
基于應(yīng)用現(xiàn)狀,本文對于人工智能在新聞媒體行業(yè)的應(yīng)用前景進(jìn)行歸納。
首先,無論是在機(jī)器寫作,還是智能編輯或者AI主播的應(yīng)用中,人工智能還處于輔助新聞媒體從業(yè)人員處理日常慣例性工作的階段,缺乏獨(dú)立思考能力,模式較為固定。隨著人工智能技術(shù)的不斷演進(jìn),新聞媒體行業(yè)會朝向更高階的智能化方向發(fā)展。例如:在未來,機(jī)器寫作能總結(jié)歸納出自己的觀點(diǎn),帶入一定的人文關(guān)懷,AI主播能具備現(xiàn)場應(yīng)激能力等。
其次,隨著人工智能技術(shù)的深化應(yīng)用必然會帶來一些負(fù)面的效果。例如:對于用戶隱私數(shù)據(jù)的過度采集和使用,新聞內(nèi)容與國家政策相悖等。今后,也需要依據(jù)相關(guān)法規(guī),利用人工智能技術(shù)制定合理高效的控制機(jī)制。
最后,新聞媒體行業(yè)從業(yè)人員也應(yīng)該逐漸認(rèn)識到人工智能技術(shù)是一些需要人為監(jiān)督和引導(dǎo)的高階算法,在提升自身業(yè)務(wù)能力的同時,也需要不斷學(xué)習(xí)和掌握如何將該技術(shù)與行業(yè)進(jìn)行更好的結(jié)合匹配。