文_夏康健
現(xiàn)今從全球范圍看,媒體智能化進入快速發(fā)展階段,可以預(yù)期,內(nèi)容生產(chǎn)與人工智能深度融合將是未來新聞傳媒重要的發(fā)展趨向。近年來,人民網(wǎng)積極聚焦前沿技術(shù)應(yīng)用,將人工智能等核心技術(shù)不斷運用于新聞生產(chǎn),以主流價值導(dǎo)向駕馭“算法”。其中,最典型、最有成效的應(yīng)用當(dāng)是創(chuàng)新建設(shè)國內(nèi)一流的“AI編輯部”,這一新技術(shù)的應(yīng)用改變了傳統(tǒng)新聞生產(chǎn)模式,有效推進新聞產(chǎn)品的生產(chǎn),大大擴展了新聞傳播的深度與廣度,進而提升了新聞專業(yè)生產(chǎn)能力與水準(zhǔn)。
“AI編輯部”的設(shè)置建設(shè)是近年來人民日報技術(shù)創(chuàng)新和人民網(wǎng)技術(shù)應(yīng)用的典型成果,它從內(nèi)容生產(chǎn)層面為人民網(wǎng)事業(yè)發(fā)展增添了強力引擎。尤其在2020-2022年全國兩會期間,先后推出3個版本的“AI編輯部”,廣泛并迅速應(yīng)用于人民網(wǎng)采編一線。在2020年兩會期間,“AI編輯部”首次亮相。此時的“AI編輯部”技術(shù)融合了人工智能的“看”“聽”“悟”“審”“查”等方面的能力,不僅為一線記者第一時間提供相關(guān)資料,也審查稿件寫作中有無錯誤,深度嵌入新聞采集和生產(chǎn)環(huán)節(jié)。在2021年兩會期間,“AI編輯部”迭代更新,形成了“2.0版本”,增加了云上精編、智能審核、智能海報、多模搜索、一鍵特寫五個創(chuàng)新功能,充分運用5G技術(shù)和邊緣計算技術(shù),保證了音像、影像等大容量數(shù)據(jù)傳送,進一步強化了“AI編輯部”在全媒體生產(chǎn)上的應(yīng)用深度與廣度。在2022年兩會期間,緊扣移動化、視頻化、智能化的媒體技術(shù)發(fā)展趨勢,“AI編輯部”提升為“3.0版本”,新增編輯移動端、5G全媒體生產(chǎn)、事實核查輔助、視頻加密暗水印、智能會議紀(jì)要、一鍵生成視頻、Cloud ME等輔助性技術(shù),用5G技術(shù)連接采訪前后方、用AI技術(shù)直抵新聞報道一線。
“AI編輯部”的技術(shù)應(yīng)用,不止于此。人民網(wǎng)處在人民日報媒體融合發(fā)展的前沿陣地,在“AI編輯部”的影響推動下,涌現(xiàn)出不少衍生技術(shù)和產(chǎn)品。比如,人民網(wǎng)將“AI編輯部”與傳統(tǒng)數(shù)據(jù)庫技術(shù)融合,形成了新的產(chǎn)品發(fā)展與演變,“時習(xí)之”專欄就是其中的典型。該專欄從“習(xí)近平系列重要講話數(shù)據(jù)庫”思路出發(fā),收錄習(xí)近平總書記系列講話重要內(nèi)容,并將其接入互聯(lián)網(wǎng)。該專欄運用“AI編輯部”的深度學(xué)習(xí)語義分析技術(shù),將“數(shù)據(jù)庫”升級為“大腦”,在可感知、可運用的前提下為受眾提供學(xué)習(xí)平臺。同時,人民網(wǎng)又充分運用既有的媒體融合成果,將“時習(xí)之”內(nèi)容延伸到“學(xué)習(xí)大國”微信公眾號,大大縮短了與受眾的傳播距離,實現(xiàn)了更“近一步”的傳播。作為“時習(xí)之”的延伸觸角和內(nèi)容二次傳播陣地,“學(xué)習(xí)大國”推出了大量成體系、多層次的學(xué)習(xí)資料包,如領(lǐng)導(dǎo)人講話原文、重點書目導(dǎo)讀、權(quán)威專家解讀等,借助移動化、社交化傳播模式實現(xiàn)與受眾的深入交流,強化生產(chǎn)者與受眾的傳播連接。
與此同時,“AI編輯部”又衍生出許多實用新技術(shù),其中事實核查輔助技術(shù)備受一線編輯記者青睞。事實核查技術(shù)主要融合了人臉識別、語音識別、自然語言理解、字幕識別、機器視覺等多項人工智能技術(shù),能夠?qū)崿F(xiàn)對文字、圖片、音頻、視頻等多種形態(tài)信息的審核。比如圖片核查技術(shù),可以對新聞稿件中的圖片進行按照傳播鏈路源頭核查,借助圖像向量引擎技術(shù),甄別出舊圖新說、版權(quán)侵權(quán)、圖文脫節(jié)等問題;或者利用智能算法,多角度比對相關(guān)度較高的文章,以核查事實不符之處。事實核查比對重點網(wǎng)站,并以中紀(jì)委、中央氣象臺、國家地震臺等官方權(quán)威數(shù)據(jù)庫為審核基準(zhǔn),從信源上確保了數(shù)據(jù)的權(quán)威性。同時,事實核查輔助技術(shù)集納了教育部、國家語言文字工作委員會的相關(guān)行業(yè)標(biāo)準(zhǔn),增強了對敏感關(guān)鍵詞和用語規(guī)范性的監(jiān)測、提升了對常識性錯誤和發(fā)音不準(zhǔn)錯誤的糾正能力,確保新聞內(nèi)容表述妥當(dāng)、精準(zhǔn)無誤。
一直以來,人民日報社高度重視技術(shù)支撐制度建設(shè),從頂層設(shè)計上確保人民網(wǎng)技術(shù)發(fā)展守正創(chuàng)新。首先,人民日報社設(shè)有專門的內(nèi)設(shè)機構(gòu)即技術(shù)部來統(tǒng)籌全報社的技術(shù)發(fā)展。其次,人民日報社規(guī)劃了“1+2+3+4+X+N”全媒體技術(shù)支撐體系。其中,“1”指的是“人民日報社媒體技術(shù)聯(lián)席會”機制,統(tǒng)籌報社技術(shù)發(fā)展規(guī)劃、重大項目、網(wǎng)絡(luò)安全和協(xié)調(diào)報社技術(shù)資源;“2”指的是傳統(tǒng)媒體和新興媒體兩條業(yè)務(wù)主線,推動媒體融合向縱深發(fā)展,真正做到“融為一體、合而為一”;“3”指的是數(shù)據(jù)中心機房、同城災(zāi)備機房和異地災(zāi)備機房3個技術(shù)支撐平臺,“4”指的是全媒體采編、涉密內(nèi)參、內(nèi)網(wǎng)辦公、網(wǎng)絡(luò)安全,面向技術(shù)服務(wù)對象;“X”指的是AI中臺、數(shù)據(jù)中臺、5G中臺、視頻中臺等公共基礎(chǔ)技術(shù),這些技術(shù)推動采編、辦公、管理一體化,為全媒體內(nèi)容創(chuàng)作賦能?!癗”是報、刊、網(wǎng)、端、微、屏等全媒體業(yè)務(wù)矩陣的融通和聯(lián)動。這一發(fā)展規(guī)劃明確了人民日報與人民網(wǎng)在技術(shù)發(fā)展上的管理關(guān)系,有序促進人民網(wǎng)技術(shù)創(chuàng)新。比如上文提到的“時習(xí)之”專欄就是由人民日報社主管,依托人民網(wǎng)建設(shè)的傳播內(nèi)容認知國家重點實驗室協(xié)作共建。
第三點和第四點是相關(guān)政府招標(biāo)采購制度與規(guī)劃版圖設(shè)計。一方面,人民日報社借助招標(biāo)采購制度保證技術(shù)發(fā)展“守正”。人工智能市場魚龍混雜,要想選擇出真正具有實用價值的技術(shù)并非易事。人民日報社規(guī)定大額標(biāo)的資產(chǎn)采購必須經(jīng)過技術(shù)部和計劃財務(wù)部的共同招標(biāo),而負責(zé)招標(biāo)的工作人員均具有較為優(yōu)秀的專業(yè)素養(yǎng),這從根源上確保了人民網(wǎng)的技術(shù)水準(zhǔn)。另一方面,從規(guī)劃版圖上看,人民網(wǎng)獨有上市公司身份,這保證其能夠不斷引入資本力量對技術(shù)展開探索。2019年,人民網(wǎng)就和中科院自動化所共同建立人工智能技術(shù)引擎和人才創(chuàng)新平臺,即“人民中科”,借助上市公司帶來的資本力量吸引國內(nèi)頂尖AI專家,實現(xiàn)智能理解團隊和技術(shù)人才儲備。這些都是孕育人工智能技術(shù)發(fā)展的重要前提。
從媒體融合發(fā)展現(xiàn)狀來看,提高新聞內(nèi)容生產(chǎn)力將是未來技術(shù)發(fā)展趨勢。目前,新聞傳播的一個突出矛盾是專題新聞策劃多、受眾新聞需求多,但是內(nèi)容生產(chǎn)不足。如何將人力資源最大限度地從重要但機械的內(nèi)容生產(chǎn)步驟中解放出來,又最大限度地投入到創(chuàng)意創(chuàng)新生產(chǎn)上,將是一項重要工作。這方面的探索和實踐也是近年來人民網(wǎng)媒體技術(shù)發(fā)展的著重點。結(jié)合人民網(wǎng)的采編播實踐,筆者認為,以下三個方向或是新聞傳媒技術(shù)融合與創(chuàng)新發(fā)展的著力點:
一是數(shù)據(jù)庫建設(shè)技術(shù)。數(shù)據(jù)庫就是寫作素材的積累庫。數(shù)據(jù)庫越強大,內(nèi)容生產(chǎn)的潛能就越強。目前,多家媒體已經(jīng)開始圍繞習(xí)近平總書記重要論述展開數(shù)據(jù)庫建設(shè),不僅囊括總書記的重要論述,也包括相關(guān)重要報道。但是,當(dāng)下數(shù)據(jù)庫建設(shè)的難題在于如何最大限度接入各類素材,尤其是在確保準(zhǔn)確無誤前提下將習(xí)近平總書記的重要論述盡可能地納入到數(shù)據(jù)庫中。目前很多媒體借助抓取技術(shù)從海量的互聯(lián)網(wǎng)信息中將內(nèi)容直接抓取出來,但這一技術(shù)無法保證內(nèi)容的準(zhǔn)確性與真實性;倘若將信息抓取只局限在幾家權(quán)威網(wǎng)站,又會導(dǎo)致數(shù)據(jù)缺乏全面性,可以說這是一項“卡脖子”技術(shù)。另一方面,如何在數(shù)據(jù)庫中準(zhǔn)確搜索到寫作者所需要的信息,也是難題。很多數(shù)據(jù)庫建設(shè)過于依賴傳統(tǒng)的搜尋模式,過于機械化且缺乏精準(zhǔn)度。目前,很多互聯(lián)網(wǎng)公司將人工智能運用到數(shù)據(jù)抓取和數(shù)據(jù)查詢中,將這一技術(shù)應(yīng)用于媒體數(shù)據(jù)庫建設(shè)也是未來重要方向。
二是智能化寫作技術(shù)。機器人寫稿發(fā)展到今天已日顯雛形。在5年前,機器人寫稿略顯稚嫩,寫出的稿件表達機械且缺乏感情,難以廣泛應(yīng)用于現(xiàn)實。但在今天,隨著人工智能技術(shù)的應(yīng)用,機器人寫稿出現(xiàn)了新情況,即“生成型人工智能”的廣泛應(yīng)用。人工智能包括兩種,即“分析型人工智能”和“生成型人工智能”。前者是傳統(tǒng)意義上的人工智能,顧名思義,重在數(shù)據(jù)分析,它興起于2016年并迅速蓬勃發(fā)展,市場規(guī)模從2016年的600億美元上漲到2021年的近3000億美元,廣泛應(yīng)用于亞馬遜、字節(jié)跳動、特斯拉等公司。生成型人工智能則是重在創(chuàng)造新事物,如創(chuàng)造文本。這種人工智能尚未完全發(fā)展成熟,但在未來有著廣闊前景。在不遠的將來,生成型人工智能將廣泛應(yīng)用于機器人寫稿中。
三是防差錯技術(shù)。對于新聞工作而言,事實錯誤帶來的傷害是不可逆的,直接損害新聞媒體在受眾心中的權(quán)威性,因此如何更好地提升事實核查效率、降低事實錯誤率,是重中之重。從實際來看,對于每家媒體,尤其是報社而言,核校是極為耗時但產(chǎn)出不明顯的工作,拴住了大量人力物力,也不能保證內(nèi)容完全無差錯。目前,人民網(wǎng)等媒體將人工智能應(yīng)用到防差錯技術(shù)中,不僅有效削減了人力資源投入,更降低了內(nèi)容差錯率。在未來,這將是新聞生產(chǎn)力進一步解放的重要突破點。