文/王曉楠
機(jī)器人新聞對(duì)新聞報(bào)道的挑戰(zhàn)與反思
文/王曉楠
機(jī)器人新聞是借助計(jì)算機(jī)程序和大數(shù)據(jù)分析而產(chǎn)生的。機(jī)器人新聞的出現(xiàn)對(duì)傳統(tǒng)新聞報(bào)道的時(shí)效性、客觀性和背景材料整合等方面帶來(lái)了挑戰(zhàn)。但這并不代表機(jī)器人新聞可以取代人工新聞報(bào)道,因?yàn)闄C(jī)器人新聞報(bào)道僅限于事實(shí),對(duì)事實(shí)背后的原因很難表達(dá),客觀性表現(xiàn)使新聞失去了人文關(guān)懷,且其提供的背景材料也是十分有限的。
中國(guó)地震臺(tái)網(wǎng)在2017年8月8日21時(shí)40分,根據(jù)測(cè)定結(jié)果自動(dòng)發(fā)布了一篇名為《四川阿壩州九寨溝縣發(fā)生7.0級(jí)地震》的短消息。在這條消息中,不僅將地震信息完整、及時(shí)、準(zhǔn)確地發(fā)布了出來(lái),同時(shí)在文章末尾中也同樣做出了這樣的標(biāo)注:“上述內(nèi)容由本站機(jī)器自行編寫(xiě),編寫(xiě)耗時(shí)25s?!痹谶@條短消息中,用540個(gè)字和4張圖片,將所需要傳遞的八項(xiàng)內(nèi)容完整地表述了出來(lái),并且在語(yǔ)法、文體上都非常規(guī)范。而在這條信息發(fā)布不久之后,被新華社官微全文引用,于3分鐘后發(fā)布了這一條消息,證明了中國(guó)地震臺(tái)網(wǎng)所發(fā)布信息的真實(shí)性和有效性。隨后,中國(guó)地震臺(tái)網(wǎng)還相繼發(fā)布了后續(xù)13次余震情況,均采用了機(jī)器人自動(dòng)生成報(bào)道的形式編寫(xiě)。
機(jī)器人新聞在中國(guó)第一次受到廣泛關(guān)注,引發(fā)了學(xué)界對(duì)機(jī)器人新聞的熱議。40年前,世界上第一個(gè)“故事寫(xiě)作機(jī)器人算法”出現(xiàn)在耶魯大學(xué),40年后的今天,隨著大數(shù)據(jù)技術(shù)的發(fā)展,機(jī)器人新聞已經(jīng)成熟。機(jī)器人新聞究竟如何運(yùn)作,對(duì)新聞業(yè)又哪些影響,存在哪些問(wèn)題,值得學(xué)界和業(yè)界關(guān)注。
筆者所介紹的“新聞機(jī)器人”,實(shí)際上是一種具有新聞素材自動(dòng)搜集并編寫(xiě)成符合人類(lèi)閱讀習(xí)慣、語(yǔ)言規(guī)范的內(nèi)容的一種算法或者軟件。也就是說(shuō),“新聞機(jī)器人”從本質(zhì)上來(lái)說(shuō),是一種通過(guò)一系列數(shù)據(jù)規(guī)則而完成新聞信息素材抓取、分析以及自動(dòng)編制成符合人類(lèi)閱讀習(xí)慣的新聞生產(chǎn)方式、方法,具有一定的創(chuàng)新性和技術(shù)性。
我國(guó)的機(jī)器人新聞起步較晚,直到近年來(lái)大數(shù)據(jù)技術(shù)發(fā)展起來(lái)后才受到關(guān)注。騰訊新聞在2015年首次發(fā)布了國(guó)內(nèi)第一篇機(jī)器人新聞——《8月CPI同比上漲2%創(chuàng)12個(gè)月新高》。同年年底,新華社的新聞機(jī)器人“快筆小新”系統(tǒng)正式上線,只要輸入一個(gè)股票代碼,“快筆小新”即可在短短3秒鐘時(shí)間里完成一篇專業(yè)性極強(qiáng)的財(cái)報(bào)分析文稿的撰寫(xiě)工作。
機(jī)器人是如何生產(chǎn)新聞的?哥倫比亞大學(xué)新聞學(xué)院Tow數(shù)字新聞中心曾把其生產(chǎn)流程分解為五個(gè)步驟:第一,學(xué)習(xí)大量標(biāo)準(zhǔn)化、結(jié)構(gòu)化的信息資料;第二,對(duì)信息資料中所隱藏的“新聞性”進(jìn)行有針對(duì)性的分析和判斷;第三,結(jié)合實(shí)際情況,將確定下的一系列報(bào)道角度,按照優(yōu)先度進(jìn)行排序;第四,匹配報(bào)道內(nèi)容和報(bào)道角度;第五,按照預(yù)先設(shè)定的流程和結(jié)構(gòu)生成新聞報(bào)道文本。
第一步,無(wú)論采用何種算法,都需要有相應(yīng)的海量數(shù)據(jù)輸入。而所輸入的數(shù)據(jù)越豐富、越“干凈”的領(lǐng)域越容易開(kāi)發(fā)出具有實(shí)用價(jià)值的自然語(yǔ)言自動(dòng)生成系統(tǒng)。數(shù)據(jù)的數(shù)量和質(zhì)量,決定了新聞機(jī)器人所能夠提供的新聞文稿的最終質(zhì)量。
第二步,完成數(shù)據(jù)輸入和讀取操作之后,算法將會(huì)對(duì)信息資料中所隱藏的“新聞性”進(jìn)行針對(duì)性的判斷和分析。算法會(huì)挑出數(shù)據(jù)中最“反?!钡姆矫?,再通過(guò)歷史數(shù)據(jù)的對(duì)比分析,找尋“不同尋?!钡牡胤?,并以此為依據(jù)判斷信息存在“新聞性”。
第三步,在判斷信息具有“新聞性”之后,算法將會(huì)結(jié)合實(shí)際情況,將確定下的一系列報(bào)道角度,按照優(yōu)先度進(jìn)行排序。而這里的報(bào)道角度,實(shí)際上是預(yù)先輸入的框架結(jié)構(gòu),選擇可行度最高的組織新聞報(bào)道的內(nèi)容。
第四步,完成上述工作之后,算法將會(huì)結(jié)合信息的實(shí)際情況,在其中搜索“故事點(diǎn)”,作為報(bào)道的主要方向。算法可以按照“接近性”原則優(yōu)先或重點(diǎn)報(bào)道相關(guān)新聞事實(shí)。
第五步,以自然語(yǔ)言的規(guī)范為基礎(chǔ),對(duì)所編纂的新聞稿件進(jìn)行潤(rùn)色。這一步對(duì)于算法的技術(shù)有著極高的要求,也同樣是影響新聞報(bào)道可讀性的主要因素。
事實(shí)表明,在一些財(cái)經(jīng)類(lèi)、體育類(lèi)的機(jī)器人新聞報(bào)道文稿中,讀者基本上無(wú)法分辨文稿是真正的人所撰寫(xiě)的,還是機(jī)器人所生成的。而這種情況的客觀存在,證明了在新聞報(bào)道領(lǐng)域,機(jī)器人或者說(shuō)機(jī)器算法的應(yīng)用有著廣闊的前景,一些特定題材的新聞已經(jīng)對(duì)新聞?dòng)浾邘?lái)了挑戰(zhàn)。
盡管不少人對(duì)機(jī)器人新聞仍存質(zhì)疑,但不可否認(rèn)的是,機(jī)器人新聞的出現(xiàn)已經(jīng)在逐漸改變一些領(lǐng)域新聞報(bào)道的情況。特別在新聞的時(shí)效性、客觀性和背景材料選擇上,可以做得比人類(lèi)的采訪報(bào)道更快、更好。
一是前所未有的時(shí)效性沖擊傳統(tǒng)時(shí)效觀念。新聞的時(shí)效性歷來(lái)是新聞的首要特點(diǎn),也是新聞報(bào)道競(jìng)爭(zhēng)的焦點(diǎn)。傳統(tǒng)的新聞采訪報(bào)道高度重視速度,甚至引發(fā)“搶新聞”的說(shuō)法。盡管互聯(lián)網(wǎng)時(shí)代,新聞時(shí)效性已經(jīng)由于出現(xiàn)自媒體現(xiàn)場(chǎng)新聞而發(fā)生了變化,但機(jī)器寫(xiě)作的出現(xiàn)卻極大提升了新聞的時(shí)效性。相對(duì)于新聞編輯來(lái)說(shuō),新聞機(jī)器人完全可以做到7×24小時(shí)在崗,只要發(fā)生突發(fā)事件,機(jī)器人就會(huì)通過(guò)各種渠道進(jìn)行數(shù)據(jù)的采集工作,并按照預(yù)先設(shè)定的算法完成稿件的編寫(xiě)工作,及時(shí)發(fā)布出去。
實(shí)踐中,機(jī)器人新聞在突發(fā)事件報(bào)道上已表現(xiàn)出不俗的成績(jī),挑戰(zhàn)了人類(lèi)新聞報(bào)道時(shí)效的極限。如,當(dāng)前已經(jīng)投入實(shí)際使用的 Wordsmifh平臺(tái),可以在1秒鐘時(shí)間完成2000篇文章的編寫(xiě)工作。而我國(guó)的新聞機(jī)器人技術(shù)也同樣處于世界領(lǐng)先水平。早在2015年,騰訊的新聞機(jī)器人就能夠根據(jù)政府所提供的CPI資料,在短短幾分鐘時(shí)間內(nèi)完成相關(guān)領(lǐng)域新聞稿件從編寫(xiě)到發(fā)布的一系列操作;2017年8月9日,新疆發(fā)生地震,中國(guó)地震臺(tái)網(wǎng)機(jī)器人新聞發(fā)布消息僅用時(shí)8秒。機(jī)器人新聞對(duì)新聞時(shí)效的挑戰(zhàn),或許將徹底改變傳統(tǒng)新聞理論中對(duì)新聞時(shí)效的認(rèn)知。新聞機(jī)器人的出現(xiàn),不僅極大地提升了新聞出產(chǎn)的效率,同時(shí)對(duì)于新聞時(shí)效性的提升所具有的重要意義更是不言而喻的。
二是基于事實(shí)的客觀性挑戰(zhàn)選擇性報(bào)道。客觀性是新聞報(bào)道的基本原則之一??陀^報(bào)道講究用事實(shí)說(shuō)話,不摻雜個(gè)人評(píng)論。在傳統(tǒng)新聞報(bào)道中,由于新聞事實(shí)是人為選擇的,無(wú)論其如何運(yùn)用事實(shí)進(jìn)行報(bào)道,終究難以擺脫人為的感情傾向,進(jìn)而影響客觀性。機(jī)器人新聞的出現(xiàn),在客觀性方面對(duì)傳統(tǒng)新聞報(bào)道“選擇性的客觀報(bào)道”帶來(lái)強(qiáng)烈沖擊。
全自動(dòng)的新聞生產(chǎn),是機(jī)器人新聞最為顯著的特征。在實(shí)際的新聞內(nèi)容撰寫(xiě)過(guò)程中,人在其中只是程序設(shè)定時(shí)發(fā)揮了作用,而整個(gè)寫(xiě)作過(guò)程都是機(jī)器人自行完成的,實(shí)現(xiàn)了寫(xiě)作主體由人向機(jī)器的轉(zhuǎn)變。機(jī)器人寫(xiě)作新聞時(shí),對(duì)已有資料或數(shù)據(jù)庫(kù)進(jìn)行大量數(shù)據(jù)采集,運(yùn)用算法對(duì)采集到的數(shù)據(jù)進(jìn)行關(guān)鍵信息提取和結(jié)構(gòu)化處理,完全是客觀存在的數(shù)據(jù)和事實(shí)。
以中國(guó)地震臺(tái)網(wǎng)對(duì)8月8日四川發(fā)生的地震報(bào)道內(nèi)容為例,機(jī)器人編纂的新聞內(nèi)容涵蓋了當(dāng)?shù)氐臒崃θ丝?、震中天氣、速?bào)參數(shù)、周邊村鎮(zhèn)、歷史地震以及震中地形和震中簡(jiǎn)介在內(nèi)的八項(xiàng)內(nèi)容。這些事實(shí)都是機(jī)器人根據(jù)程序計(jì)算出來(lái)的,完整全面且客觀地報(bào)道了相關(guān)事實(shí)。而如果換作是人類(lèi)記者采訪,難免會(huì)根據(jù)其認(rèn)定的新聞價(jià)值進(jìn)行選擇。
三是背景材料整合力度超出人為搜集。作為新聞中描繪事件環(huán)境、人物客觀條件、烘托主題的重要內(nèi)容,新聞背景對(duì)于新聞信息立體化有著重要的現(xiàn)實(shí)意義。在深度報(bào)道中,新聞背景材料的運(yùn)用可以使報(bào)道更加全面、完整,加強(qiáng)報(bào)道的深度。特別是新媒體的發(fā)展對(duì)傳統(tǒng)新聞報(bào)道帶來(lái)沖擊之后,基于背景材料的整合的深度報(bào)道甚至被視為迎接挑戰(zhàn)的出路。
機(jī)器人新聞的出現(xiàn),沖擊了傳統(tǒng)新聞報(bào)道人工的資料搜集整理工作。在機(jī)器人新聞的產(chǎn)生和發(fā)展過(guò)程中,互聯(lián)網(wǎng)數(shù)據(jù)、用戶生成內(nèi)容等資源起到了重要的推動(dòng)作用。而數(shù)據(jù)挖掘等技術(shù),則為機(jī)器人新聞素材的整合奠定了堅(jiān)實(shí)的基礎(chǔ)。機(jī)器人新聞對(duì)背景材料及數(shù)據(jù)的搜集整理廣度、深度和時(shí)效都是人工所不能達(dá)到的。
機(jī)器人新聞在給傳統(tǒng)新聞報(bào)道帶來(lái)挑戰(zhàn)的同時(shí),存在一些技術(shù)本身所無(wú)法避免的問(wèn)題。正是因?yàn)榇嬖谶@些問(wèn)題,讓我們可以冷靜看待機(jī)器人新聞的意義,而不至于過(guò)于夸大機(jī)器人新聞的作用。
一是報(bào)道對(duì)象限于客觀事實(shí)。機(jī)器人新聞是基于計(jì)算機(jī)軟件程序和大數(shù)據(jù)分析的,這就導(dǎo)致機(jī)器人新聞只能在擁有龐大數(shù)據(jù)的分析基礎(chǔ)上產(chǎn)生。然而,新聞事實(shí)往往不僅限于新聞事件本身,還有各種歷史和背景信息,有宏觀真實(shí)和微觀真實(shí)之分,機(jī)器人新聞在這些事實(shí)的判斷上顯然缺乏人工新聞的智能。
所以,新聞機(jī)器人的應(yīng)用,只能局限于固定的部分領(lǐng)域之中。實(shí)際上,在這些可供新聞機(jī)器人發(fā)揮作用的新聞?lì)I(lǐng)域中,客觀的數(shù)據(jù)及分析是其最大優(yōu)勢(shì),而一旦進(jìn)入時(shí)政、文化、社會(huì)類(lèi)新聞,必然受限于數(shù)據(jù)。即便是這些機(jī)械化的領(lǐng)域,機(jī)器人新聞也只能在分析結(jié)果基礎(chǔ)上根據(jù)人工設(shè)定程度選擇新聞點(diǎn),套用相應(yīng)的模板生成新聞內(nèi)容??梢?jiàn),機(jī)器人在新聞寫(xiě)作上的創(chuàng)造力,實(shí)際上仍然是人類(lèi)創(chuàng)造力的直接體現(xiàn),大可不必對(duì)其心懷憤懣。
二是客觀形式缺乏人文關(guān)懷。誠(chéng)然,客觀報(bào)道是新聞報(bào)道的原則。但是,新聞報(bào)道之所以有魅力,在于其深刻的人文關(guān)懷,一則缺乏人文關(guān)懷的新聞將失去靈性,顯得乏味。因此,在機(jī)器人新聞發(fā)展勢(shì)頭強(qiáng)勁,業(yè)界、學(xué)界贊譽(yù)有加之時(shí),我們也應(yīng)當(dāng)意識(shí)到其技術(shù)上的不足,導(dǎo)致機(jī)器人記者只能以現(xiàn)有的模板和知識(shí)庫(kù)為基礎(chǔ)撰寫(xiě)新聞文稿,不僅模式化問(wèn)題嚴(yán)重,而且缺乏人文氣息、缺乏必要的情感。
美國(guó)國(guó)家公共電視臺(tái)在2015年組織了一場(chǎng)新聞編輯和新聞機(jī)器人新聞稿件撰寫(xiě)比賽。雖然新聞機(jī)器人只用了短短2分鐘就完成了撰寫(xiě)工作,但是在文章質(zhì)量的投票上,得票數(shù)卻遠(yuǎn)遠(yuǎn)少于人類(lèi)所撰寫(xiě)的新聞。從中我們可以發(fā)現(xiàn),新聞機(jī)器人所生成的新聞難以具有足夠的吸引力,對(duì)受眾而言,顯得“冰冷”而缺乏吸引力。
究其原因有三點(diǎn):一是新聞機(jī)器人在實(shí)際應(yīng)用過(guò)程中,只能呆板地提取知識(shí)庫(kù)和模板庫(kù)中的東西,而不可能對(duì)情緒做出有效的判斷;二是新聞機(jī)器人很難做到歸因和舉證,無(wú)法引導(dǎo)讀者深入思考新聞;三是新聞機(jī)器人本身嚴(yán)重依賴于內(nèi)置邏輯的特征決定了無(wú)法適應(yīng)敘事性新聞稿件的撰寫(xiě)要求。
三是背景材料限于事實(shí)材料。新聞背景材料的內(nèi)容是十分廣泛的,它不僅涵蓋了相應(yīng)的社會(huì)背景、歷史條件等內(nèi)容,同時(shí)也必然涉及到政治背景、知識(shí)背景等一系列新聞環(huán)境。與此同時(shí),新聞背景運(yùn)用方式上的差異,也同樣可以將其進(jìn)一步劃分為說(shuō)明性背景材料、對(duì)比性背景材料、注釋性背景材料等多種情況。在實(shí)際的報(bào)道過(guò)程中,結(jié)合同期聲、錄像、圖片以及各種電腦圖表等一系列聲畫(huà)資料,可以給受眾以直觀的感受。
如上文所述,機(jī)器人新聞受技術(shù)自身限制,報(bào)道范圍集中在體育、經(jīng)濟(jì)、災(zāi)難等涉及大量數(shù)據(jù)、圖表和量化分析的專業(yè)領(lǐng)域。這些背景材料存在其局限性:一方面,背景材料是否可以進(jìn)入新聞,取決于軟件程序員編程時(shí)的設(shè)定;另一方面,對(duì)一些社會(huì)背景、知識(shí)背景類(lèi)的材料,機(jī)器人很難根據(jù)程序獲得。事實(shí)上,機(jī)器人新聞的背景材料,在信息海洋中是十分有限的,況且很多背景材料受眾可以通過(guò)網(wǎng)絡(luò)渠道獲得,并未體現(xiàn)出人為加工后的特定語(yǔ)境和用意。
作者系吉林師范大學(xué)傳媒學(xué)院講師
本文系2015年吉林省社會(huì)科學(xué)基金項(xiàng)目(基地項(xiàng)目)“新媒體語(yǔ)境下吉林省傳統(tǒng)文化的傳播與發(fā)展研究”(項(xiàng)目編號(hào):2015JD7)的研究成果。