張建偉
(新華社北美總分社)
隨著大數(shù)據(jù)、人工智能技術(shù)的發(fā)展,新聞行業(yè)迎來(lái)了歷史性的變革。新聞機(jī)構(gòu)利用人工智能和大數(shù)據(jù)技術(shù)不斷推動(dòng)新聞業(yè)態(tài)的發(fā)展。從寫稿機(jī)器人到個(gè)性化新聞推薦,新技術(shù)給新聞業(yè)注入了新的能量。
特別是在自然語(yǔ)言處理(NLP)技術(shù)領(lǐng)域,新聞媒體在這方面進(jìn)行了較多的探索。比如,NLP技術(shù)對(duì)眾包的數(shù)據(jù)進(jìn)行清洗和預(yù)處理?;蛟谛侣劸庉嫮h(huán)節(jié)使用自然言語(yǔ)生成(NLG)技術(shù)優(yōu)化新聞制作;使用推薦算法個(gè)性化新聞推送;或使用聊天機(jī)器人(chat bot)與用戶的實(shí)時(shí)互動(dòng)。
根據(jù)相關(guān)新聞機(jī)構(gòu)的調(diào)查發(fā)現(xiàn),年輕讀者一方面對(duì)涉及公共服務(wù)且具有重要價(jià)值的新聞故事表現(xiàn)出濃厚的興趣;另一方面,對(duì)采用大段文字?jǐn)⑹碌男侣剟t缺少耐心逐段閱讀。為此,國(guó)外新聞機(jī)構(gòu)希望通過采用漫畫+文字的形式來(lái)發(fā)布新聞信息,通過此形式吸引更多的讀者。[1]
雖然圖表、漫畫新聞表現(xiàn)形式并非首創(chuàng),在新華社攝影新聞報(bào)道中已經(jīng)是普遍采用的一種新聞形式。但圖表新聞的制作過程對(duì)編輯仍存在不小的技術(shù)挑戰(zhàn):比如,如何快速、準(zhǔn)確的挑選適合新聞主題的素材;如何將各種矢量圖片組合并制作成最終的漫畫模板。上述這些工作,即使對(duì)經(jīng)驗(yàn)豐富的編輯也是一項(xiàng)費(fèi)時(shí)的工作。能否將圖表新聞通過計(jì)算機(jī)自動(dòng)完成,提高新聞制作效率,減輕編輯的工作壓力,就成為自動(dòng)化圖表新聞主要解決的問題。
有新聞媒體曾啟動(dòng)了為期6個(gè)月的一項(xiàng)實(shí)驗(yàn),實(shí)驗(yàn)的主要目的就是嘗試通過計(jì)算機(jī)自動(dòng)制作圖表新聞。第一期實(shí)驗(yàn)為期6周,主要是驗(yàn)證技術(shù)可行性。據(jù)介紹,為了降低項(xiàng)目復(fù)雜度,項(xiàng)目組將問題聚焦在公共健康方面的新聞,主要因?yàn)樵擃愋侣劥蠖嗑哂邢嗨频慕Y(jié)構(gòu),多數(shù)內(nèi)容是關(guān)于醫(yī)學(xué)方面的新發(fā)現(xiàn)或新療法。他們首先了解公共健康新聞的結(jié)構(gòu)、重要的新聞構(gòu)成要素。在此基礎(chǔ)上,項(xiàng)目組對(duì)新聞制作流程進(jìn)行了分解。[2]
項(xiàng)目組首先利用自然語(yǔ)言處理技術(shù)中相對(duì)成熟的“命名實(shí)體識(shí)別(NER)”技術(shù)來(lái)鑒別文字稿件中的關(guān)鍵實(shí)體信息;再將算法識(shí)別出來(lái)的實(shí)體信息作為參數(shù),調(diào)取圖片檢索技術(shù)查找適合的漫畫素材,通過預(yù)制的模板將文字新聞和漫畫背景渲染成一幅漫畫。這個(gè)原型服務(wù)通過網(wǎng)頁(yè)應(yīng)用的形式開放給編輯使用。編輯通過該網(wǎng)頁(yè)應(yīng)用,可以將精力集中于文字編輯,系統(tǒng)后臺(tái)完成漫畫搜索和模板渲染的工作,并將最終結(jié)果呈現(xiàn)給編輯,供編輯做進(jìn)一步的調(diào)整和完善。
根據(jù)項(xiàng)目一期的效果 ,項(xiàng)目組啟動(dòng)了第二階段的實(shí)驗(yàn),仍然是6周時(shí)間。這一階段,項(xiàng)目組著重解決漫畫自動(dòng)化生成的準(zhǔn)確度和效率問題。為此項(xiàng)目組設(shè)計(jì)了一套自然語(yǔ)言處理的流水線,并對(duì)NER信息提取的算法進(jìn)行了改進(jìn)。
由于該系統(tǒng)主要利用NER技術(shù)來(lái)解析新聞稿件中的關(guān)鍵信息,此環(huán)節(jié)的準(zhǔn)確程度決定了后續(xù)漫畫模板的選擇是否準(zhǔn)確合理。為了使第一步關(guān)鍵信息提取更加準(zhǔn)確,項(xiàng)目組嘗試了多種方式,包括提取一組相關(guān)的實(shí)體信息名,讓記者選擇最相關(guān)的關(guān)鍵字并保留下來(lái)作為圖片檢索的參數(shù)。還嘗試直接允許編輯輸入關(guān)鍵字。
為了試圖讓系統(tǒng)自動(dòng)挑選出最適合的圖片作為漫畫新聞素材,項(xiàng)目組根據(jù)醫(yī)療健康新聞特點(diǎn),設(shè)計(jì)了一套規(guī)則。比如,如果在文字稿件中檢測(cè)到數(shù)字信息,系統(tǒng)會(huì)生成一個(gè)簡(jiǎn)單的數(shù)據(jù)可視化圖;如果編輯輸入了引言,系統(tǒng)會(huì)將引言自動(dòng)添加到圖片對(duì)話框,并標(biāo)注被引用者的信息。
然而,在這一階段的實(shí)驗(yàn)中,項(xiàng)目組發(fā)現(xiàn)理想與現(xiàn)實(shí)的差距,比如:醫(yī)學(xué)領(lǐng)域經(jīng)常會(huì)發(fā)布一些有關(guān)疑難疾病的創(chuàng)新療法,此時(shí)利用自動(dòng)化的系統(tǒng)很難將NER信息給出對(duì)應(yīng)的漫畫素材相映射,找到合適素材或模板。為此,項(xiàng)目組邀請(qǐng)認(rèn)知科學(xué)家、漫畫理論家共同參與設(shè)計(jì)新聞模板,利用更加通用的漫畫模板盡量完善系統(tǒng)自動(dòng)化流程。
2020年10 月,項(xiàng)目組使用該系統(tǒng)制作了一條有關(guān)新冠疫情的新聞,并發(fā)布在臉書和Instagram的“限時(shí)動(dòng)態(tài)”中。目前該原型產(chǎn)品已經(jīng)應(yīng)用在媒體內(nèi)部的健康新聞小組。利用該系統(tǒng),編輯僅專注于完成文字編寫工作,系統(tǒng)完成新聞主題的識(shí)別,根據(jù)識(shí)別出的主題搜索恰當(dāng)?shù)穆嬆0澹⑦M(jìn)行合成渲染。
新冠疫情在很大程度上改變了人們生活、工作的方式。特別是在2020年疫情期間,對(duì)病毒的恐懼,迫使人們不得不選擇大部分時(shí)間居家辦公。與此同時(shí),鋪天蓋地的虛假新聞和錯(cuò)誤的信息,也使人們變得無(wú)所適從。
對(duì)于媒體來(lái)說(shuō),讓受眾在第一時(shí)間獲取到真實(shí)、可靠的信息,自然成為新聞機(jī)構(gòu)追求的首要目標(biāo)。特別是在疫情肆虐的時(shí)期,人們對(duì)各種資源的需求更加迫切。為用戶提供一條暢通且可靠的疫情信息播報(bào)通道,也就成為各新聞機(jī)構(gòu)要解決的一個(gè)重要問題。
另外,隨著社交媒體平臺(tái)的不斷發(fā)展,像微信、微博已經(jīng)成為新聞消費(fèi)者的重要社交網(wǎng)絡(luò)平臺(tái)。據(jù)路透社的一個(gè)統(tǒng)計(jì)報(bào)告,在2018年至2020年期間,大約有1/3的國(guó)外用戶通過臉書獲取新聞,部分國(guó)家甚至更高。社交媒體成為人們獲取新聞的主要途徑。[3]
正因?yàn)樯缃幻襟w在新聞傳播方面的巨大影響力,有媒體選擇嘗試將聊天機(jī)器人與臉書的聊天應(yīng)用(Facebook Messenger)相結(jié)合,發(fā)布新聞信息。一方面,疫情期間,記者可以在家方便地更新相關(guān)信息;另一方面,隨著人工智能技術(shù)的進(jìn)步,聊天機(jī)器人解決方案也已成熟;而且,根據(jù)臉書的統(tǒng)計(jì),臉書的聊天客戶端在疫情開始階段的使用頻率呈現(xiàn)爆發(fā)式增長(zhǎng)?;谏鲜鲈?,將聊天機(jī)器人(chat bot)集成到臉書的聊天應(yīng)用程序,或許是個(gè)不錯(cuò)的實(shí)踐。[3]
該新聞機(jī)構(gòu)嘗試使用一款名為“德克斯特”(Dexter)的第三方工具作為聊天機(jī)器人的引擎。借助臉書的Messenger應(yīng)用通道,記者除了發(fā)布最新的疫情感染數(shù)字以及相關(guān)的封城措施外,同時(shí)推送其他附加內(nèi)容,以防止人們錯(cuò)過重要的新聞資訊。機(jī)器人可與用戶進(jìn)行實(shí)時(shí)互動(dòng),根據(jù)用戶輸入的內(nèi)容,為用戶提供相關(guān)的視頻新聞或有關(guān)醫(yī)護(hù)工作人員那些振奮人心的感人事跡。[4]
該新聞機(jī)構(gòu)首先在東南亞部署了測(cè)試版程序,用于獲取用戶和機(jī)器人的交互情況。三周后,項(xiàng)目組增加了訂閱功能,允許系統(tǒng)自動(dòng)推送信息。根據(jù)項(xiàng)目組收集到的數(shù)據(jù)顯示:大約1/3曾與機(jī)器人交互過的用戶選擇訂閱該服務(wù)。該項(xiàng)目在越南和孟加拉兩個(gè)國(guó)家進(jìn)行了部署,這兩地的新聞團(tuán)隊(duì)負(fù)責(zé)每天更新最新的疫情數(shù)據(jù)。這兩組機(jī)器人總計(jì)收發(fā)大約一百萬(wàn)條交互信息。這一交互數(shù)量遠(yuǎn)高于項(xiàng)目組的預(yù)期。
根據(jù)用戶與聊天機(jī)器人的交互情況,項(xiàng)目組發(fā)現(xiàn):當(dāng)新聞發(fā)布機(jī)構(gòu)自動(dòng)推送的消息對(duì)用戶來(lái)說(shuō)是重要話題時(shí),用戶的訂閱意愿十分強(qiáng)烈。另外,臉書的收件箱是一個(gè)未被充分利用的空間,特別是對(duì)于聊天機(jī)器人等智能化交互,這一通道是一個(gè)成熟交互途徑,也是可以充分開發(fā)的交互方式。但同時(shí),如何讓用戶發(fā)現(xiàn)聊天機(jī)器人這一功能,確實(shí)是一個(gè)挑戰(zhàn)。目前項(xiàng)目組使用的方法就是通過廣告宣傳,通過在各種渠道宣傳,讓用戶知道并發(fā)現(xiàn)這個(gè)服務(wù)。另外,在2020年的秋天,該新聞機(jī)構(gòu)嘗試在美國(guó)大選期間利用機(jī)器人推送相關(guān)消息,并與用戶互動(dòng),提供詳細(xì)的選情報(bào)道,采用的也是類似的解決方案。
上述兩個(gè)項(xiàng)目是國(guó)外新聞機(jī)構(gòu)將人工智能技術(shù)與新聞生產(chǎn)和傳播相結(jié)合的典型案例,這其中既有利用計(jì)算機(jī)輔助編輯、記者提高新聞播發(fā)效率;也有通過新技術(shù)增強(qiáng)與用戶互動(dòng),獲取用戶行為數(shù)據(jù),進(jìn)一步指導(dǎo)新聞編發(fā)工作。
筆者所在單位,在人工智能應(yīng)用方面進(jìn)行了一些探索,諸如在編輯部使用的新一代采編系統(tǒng)中囊括了諸多人工智能工具,比如:智能檢校、語(yǔ)音識(shí)別、智能輔助翻譯、圖片文字識(shí)別等,都是利用自然語(yǔ)言處理技術(shù)實(shí)現(xiàn)工作的自動(dòng)化。這些實(shí)踐在實(shí)際工作中已經(jīng)發(fā)揮了重要的作用,有效提高了新聞制作效率,節(jié)約了時(shí)間,獲得編輯、記者的好評(píng)。有記者反饋,利用語(yǔ)音識(shí)別工具,可極大提高采訪素材處理效率,原來(lái)需要幾個(gè)小時(shí)才能處理完成的文字素材,可通過AI工具在幾分鐘內(nèi)即可完成初加工,記者可以將更多的精力投入到深度內(nèi)容的挖掘中。
由此可見,人工智能技術(shù)能夠有效提升新聞制作效率,因此應(yīng)該充分利用這一技術(shù)優(yōu)勢(shì),將人工智能技術(shù)與新聞制作、傳播更多的進(jìn)行融合。根據(jù)不同的應(yīng)用場(chǎng)景或新聞形式,設(shè)計(jì)相應(yīng)的新聞制作工作流引擎,將原始素材的初加工、查詢工作自動(dòng)化,讓編輯將更多的精力放在新聞故事的創(chuàng)作上。讓新聞采編工作全流程進(jìn)入智能化、自動(dòng)化的快車道。
其次,隨著技術(shù)不斷進(jìn)步,新聞行業(yè)也正在經(jīng)歷翻天覆地的變革,各種創(chuàng)新層出不窮。新華社作為國(guó)家通訊社,如何履行好黨中央“喉舌”“耳目”職能,發(fā)揮正確引導(dǎo)國(guó)內(nèi)輿論、積極影響國(guó)際輿論的重要作用,是新聞工作者同樣也是技術(shù)創(chuàng)新的初心和使命。與此同時(shí),也不能忽視的是在當(dāng)下這個(gè)時(shí)代,新聞創(chuàng)新可能不再是開創(chuàng)單一的傳播渠道,而是以為多樣化的受眾提供真正有價(jià)值的數(shù)字新聞體驗(yàn)為目標(biāo)。數(shù)字媒體生態(tài)系統(tǒng)的加速變化要求新聞從業(yè)者改變傳統(tǒng)的制作、分發(fā)和傳播新聞的方式。如何在完成國(guó)家通訊社的職能和使命的同時(shí),為多樣的用戶提供個(gè)性化的新聞產(chǎn)品,也是我社面臨的一個(gè)重要議題。
最后,雖然智能化、自動(dòng)化可在一定程度上提高新聞制作效率,但自動(dòng)化新聞系統(tǒng)永遠(yuǎn)無(wú)法替代編輯、記者的工作。再多的自動(dòng)化系統(tǒng)也無(wú)法取代和構(gòu)建講述好故事的技能。在這里,自動(dòng)化系統(tǒng)為講好故事提供了必要的支持,而不是取代它。明確了這兩者的關(guān)系定位,也就更加清楚地認(rèn)識(shí)到在構(gòu)建自動(dòng)化系統(tǒng)的實(shí)踐中,僅有工程師的參與是不夠的。正如英國(guó)衛(wèi)報(bào)數(shù)據(jù)博客編輯西蒙·羅杰斯所指出的:新聞編輯部的布局很有講究,如果你越靠近新聞編輯部,就更加方便進(jìn)行新聞報(bào)道的交流,這是新聞策劃過程中必不可少的一部分;反之,則兩者距離越來(lái)越遠(yuǎn)。這也從另一方面闡明:專家型新聞人才與技術(shù)團(tuán)隊(duì)相互協(xié)作,是新聞自動(dòng)化系統(tǒng)成功構(gòu)建的必要條件。比如,在上述開發(fā)自動(dòng)化圖表新聞項(xiàng)目中,項(xiàng)目組還邀請(qǐng)了認(rèn)知科學(xué)家、漫畫理論家、一線記者共同參與項(xiàng)目中,提出各自專業(yè)的見解。
綜上所述,利用人工智能技術(shù),特別是自然語(yǔ)言處理技術(shù)提升新聞報(bào)道時(shí)效性是時(shí)代的必然。新聞媒體要適應(yīng)新時(shí)代新聞制作、傳播的特點(diǎn),利用新技術(shù)切實(shí)履行好信息傳播、輿論引導(dǎo)的使命。同時(shí),新聞人和技術(shù)工程師的密切合作是開啟通往新聞智能化大門的金鑰匙。