李強(qiáng) 西南大學(xué)新聞傳媒學(xué)院
技術(shù)的進(jìn)步是歷次工業(yè)革命的驅(qū)動(dòng)力,而人類社會正在人工智能技術(shù)的進(jìn)步下進(jìn)入智能化社會,即所謂的“第三次工業(yè)革命”。2016年谷歌AlphaGo(阿爾法狗)以5比3的成績戰(zhàn)勝了世界圍棋冠軍李世石,這場機(jī)器人對決人類的完勝和人工智能在例如語音識別,新聞寫作,醫(yī)療和翻譯等諸多方面的運(yùn)用宣告了一個(gè)人工智能時(shí)代的到來。
目前的機(jī)器人新聞寫作,報(bào)道的生成主要有兩種方式,一種是根據(jù)人類自然語言的成分,進(jìn)行自然語言的編排生成的處理模型,機(jī)器人獲得數(shù)據(jù)后,經(jīng)過分析直接將數(shù)據(jù)轉(zhuǎn)化為人類語言,再經(jīng)過處理生成為最終的新聞報(bào)道。這種處理模型經(jīng)過進(jìn)化,理論上來說可以媲美人類記者的新聞稿件。另一種是預(yù)先埋入模板的寫作類型,根據(jù)新聞?lì)愋皖A(yù)先準(zhǔn)備好一個(gè)寫作模板,在機(jī)器人獲得數(shù)據(jù)后,將擁有的數(shù)據(jù)填充進(jìn)去,最后撰寫成新聞報(bào)道。
由于受限于人工智能科技的發(fā)展水平還不夠高,目前機(jī)器人新聞寫作主要集中在財(cái)經(jīng)新聞與體育新聞方面,這樣規(guī)格化比較高的新聞?lì)愋汀N覍⒃谙挛慕Y(jié)合具體新聞文本進(jìn)行分析。
財(cái)經(jīng)新聞,又稱財(cái)經(jīng)消息,是一個(gè)比較寬泛的概念,只要是與經(jīng)濟(jì)活動(dòng)相關(guān)的新聞報(bào)道都可以叫做財(cái)經(jīng)新聞。按照騰訊的標(biāo)準(zhǔn)財(cái)經(jīng)消息的完整分類如下:宏觀、金融、證券、港股、美股、國際、公司、新三板、理財(cái)、基金保險(xiǎn)、大數(shù)據(jù)、視頻,一共13類。目前機(jī)器人新聞主要涉及到的分類是宏觀、證券和公司。
國內(nèi)主要新聞機(jī)器人中以報(bào)道財(cái)經(jīng)新聞見長的是騰訊公司的“Dreamwriter”。下面我將對這家的財(cái)經(jīng)新聞文本進(jìn)行比較分析。
宏觀財(cái)經(jīng)新聞寫作模板。目前機(jī)器人新聞宏觀財(cái)經(jīng)新聞寫作以CPI報(bào)道為主。根據(jù)2015年騰訊財(cái)經(jīng)推出的由“Dreamwriter”撰寫的《10月份CPI漲幅繼續(xù)回落 低通脹風(fēng)險(xiǎn)可能升溫》等一系列CPI報(bào)道,可以分析得出?!癉reamwriter”撰寫的宏觀財(cái)經(jīng)新聞模板結(jié)構(gòu)是,首段提供確切宏觀新聞數(shù)據(jù)和事實(shí),并且給出新聞出處,如“國家統(tǒng)計(jì)局周二公布數(shù)據(jù)顯示”。第二段引入相關(guān)專家的看法,如“國家統(tǒng)計(jì)局城市司高級統(tǒng)計(jì)師余秋梅認(rèn)為”。接下來的幾段引入不同相關(guān)人士的觀點(diǎn),如“海通證券首席宏觀分析師姜超表示”。最后一段通常為相關(guān)的背景信息或者補(bǔ)充解釋,比如“居民消費(fèi)價(jià)格指數(shù)(Consumer Price Index,簡稱CPI)”。另外,“Dreamwriter”撰寫的宏觀新聞通常會附有相關(guān)的視頻報(bào)道,但是不是機(jī)器人新聞,而是人類記者制作的視頻新聞。
該類寫作模板可以總結(jié)為,引用統(tǒng)計(jì)局的相關(guān)數(shù)據(jù)、統(tǒng)計(jì)局方面對數(shù)據(jù)的解讀,以及相關(guān)專家的研究觀點(diǎn)。另外附加上相關(guān)的視頻新聞或圖片。
本文通過對于機(jī)器人新聞寫作當(dāng)中寫作模板的研究發(fā)現(xiàn),目前的寫作模板還主要是規(guī)格化的文字組合成的模板。這種寫作模板在分化數(shù)據(jù)和新聞事實(shí)足夠細(xì)致時(shí),所生產(chǎn)的新聞報(bào)道也足以媲美人類記者的新聞稿件。但是隨著人工智能技術(shù)的逐漸發(fā)展,這種依靠寫作模板的機(jī)器人新聞的范圍將更局限于高規(guī)格化的新聞?lì)I(lǐng)域。而其他的新聞,如深度報(bào)道,將會由基于自然語言生成的處理模型這類的新聞機(jī)器人。機(jī)器人新聞寫作也會朝向個(gè)性化,可視化,人機(jī)一體和更廣闊的報(bào)道領(lǐng)域發(fā)展。