文/李璇 王明明
(作者單位:河北經(jīng)貿(mào)大學(xué))
數(shù)據(jù)新聞是大數(shù)據(jù)對(duì)新聞行業(yè)滲透的產(chǎn)物。數(shù)據(jù)新聞具有兩個(gè)最顯著的特點(diǎn):(1)數(shù)據(jù)的支撐和直觀的呈現(xiàn)方式。數(shù)據(jù)的支持可以細(xì)分到兩點(diǎn),一是數(shù)據(jù)新聞的價(jià)值衡量可以通過(guò)對(duì)數(shù)據(jù)庫(kù)里的數(shù)據(jù)進(jìn)行抓取、分析,依據(jù)受眾的信息需求欲望給予一定的價(jià)值判斷;二是數(shù)據(jù)新聞報(bào)道方式的內(nèi)容是充滿著數(shù)據(jù)的,是用數(shù)據(jù)呈現(xiàn)新聞報(bào)道的主題和角度的,是通過(guò)對(duì)數(shù)據(jù)相關(guān)性的分析來(lái)報(bào)道事實(shí)。(2)數(shù)據(jù)新聞的呈現(xiàn)方式是可視化的,是直觀簡(jiǎn)潔的,這是它對(duì)傳統(tǒng)的新聞報(bào)道方式最為明顯的改進(jìn)。
選題是數(shù)據(jù)新聞的第一步。做數(shù)據(jù)新聞的選題要注重兩方面因素:一是新聞價(jià)值,二是這個(gè)內(nèi)容是否適用于數(shù)據(jù)新聞的呈現(xiàn)方式。
數(shù)據(jù)的收集和整理需要耗費(fèi)一定的時(shí)間,因此,在時(shí)效性方面可能比不上傳統(tǒng)新聞。在選題策劃的時(shí)候要充分考慮新聞?lì)愋蛯?duì)時(shí)效性的要求。數(shù)據(jù)新聞揭示的是數(shù)據(jù)背后的邏輯關(guān)系,往往是對(duì)現(xiàn)有的新聞數(shù)據(jù)的再次使用和深挖,發(fā)現(xiàn)其背后的關(guān)系,這無(wú)疑決定數(shù)據(jù)新聞在確定選題時(shí)必然注重選題顯著性,這樣才使新聞數(shù)據(jù)有挖掘的意義。選題的接近性是指選題與受眾的關(guān)聯(lián)意識(shí)。在策劃選題前,選題與受眾的接近性,這種接近性的程度有多高?這都是應(yīng)該考慮的,是通過(guò)大數(shù)據(jù)可以得到這種關(guān)聯(lián)程度的準(zhǔn)確排位的。
數(shù)據(jù)新聞的報(bào)道特點(diǎn)是將數(shù)據(jù)間的相互關(guān)系通過(guò)可視化的技術(shù)呈現(xiàn)在觀眾面前,這里的呈現(xiàn)類型包括圖片和文字、音頻、視頻等,都是數(shù)據(jù)新聞可視化呈現(xiàn)方式。數(shù)據(jù)新聞主要適用于一些數(shù)據(jù)量大且數(shù)據(jù)之間存在某種關(guān)系,這種關(guān)系的揭示和深挖具有新聞價(jià)值。
數(shù)據(jù)新聞數(shù)據(jù)的收集因?yàn)閿?shù)據(jù)的廣泛性需要根據(jù)選題有針對(duì)性地收集數(shù)據(jù)。數(shù)據(jù)新聞數(shù)據(jù)的收集主要是通過(guò)爬蟲(chóng)工具實(shí)現(xiàn),比如 Arachnid、Crawlzilla、Python等數(shù)據(jù)的篩選,是確保新聞?wù)鎸?shí)性的有效途徑。在數(shù)據(jù)收集的同時(shí)進(jìn)行數(shù)據(jù)篩選可以為下一步數(shù)據(jù)分析提供一個(gè)有價(jià)值的分析量。數(shù)據(jù)的真實(shí)性取決于數(shù)據(jù)來(lái)源的可信度。目前,數(shù)據(jù)新聞報(bào)道中的數(shù)據(jù)大都來(lái)源于政府公開(kāi)的數(shù)據(jù)、非政府機(jī)構(gòu)收集的數(shù)據(jù)、企業(yè)等。在數(shù)據(jù)收集之后進(jìn)行篩選,主要是對(duì)收集的數(shù)據(jù)進(jìn)行清洗。非政府機(jī)構(gòu)收集的數(shù)據(jù)是否全面真實(shí)?企業(yè)提供的數(shù)據(jù)是否出于利益有所失實(shí)?媒體自我收集的數(shù)據(jù)是否帶有片面性?這些都是在數(shù)據(jù)清洗過(guò)程中要注意的,清洗掉那些不真實(shí)、不必要的數(shù)據(jù),為下一步數(shù)據(jù)分析提供一個(gè)良好的環(huán)境。
數(shù)據(jù)分析可以從數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)背后的故事和價(jià)值,讓數(shù)據(jù)能夠成功地成為新聞。數(shù)據(jù)的分析還可以挖掘出好的新聞選題。
面對(duì)雜亂無(wú)章的數(shù)據(jù),分析者首先要將收集到的數(shù)據(jù)統(tǒng)一化,便于觀察和分析;其次,在數(shù)據(jù)分析時(shí)要注重每一個(gè)數(shù)據(jù)的關(guān)系變化。數(shù)據(jù)分析可以明確數(shù)據(jù)新聞的報(bào)道內(nèi)容,不同的分析層面決定了數(shù)據(jù)新聞不同的深度和廣度,以及報(bào)道的故事性呈現(xiàn)方式。在數(shù)據(jù)分析的過(guò)程中,關(guān)注數(shù)據(jù)極值的出現(xiàn),注重?cái)?shù)據(jù)之間的對(duì)比關(guān)系和邏輯關(guān)系,善于觀察數(shù)據(jù)發(fā)展的趨勢(shì),大膽地推測(cè)并進(jìn)行有效的驗(yàn)證,這些都是數(shù)據(jù)新聞分析中常用的方法。數(shù)據(jù)分析的工具主要有:ERP、Matlab、SAS、SPSS等,這些工具都是較專業(yè)的數(shù)據(jù)分析工具。
數(shù)據(jù)新聞的可視化呈現(xiàn)形式主要包括各種靜動(dòng)態(tài)圖表。根據(jù)具體的主題選用不同的背景類型的圖表形式,從而將數(shù)據(jù)新聞信息的邏輯關(guān)系秩序化和形象化。目前出現(xiàn)的圖表形式主要有以地圖為背景的、以羅盤(pán)為背景的,以地平線為背景的,以城市為背景的和山脈為背景的等,還有一些流程圖、樹(shù)狀圖、熱力圖和散點(diǎn)圖等,具體哪種類型比較適合所需報(bào)道的數(shù)據(jù)新聞內(nèi)容,這要結(jié)合具體的數(shù)據(jù)意義來(lái)選擇。目前廣泛使用的可視化制作工具主要包括icharts 和tableau等。最后,一定要對(duì)可視化的圖表進(jìn)行潤(rùn)色,比如對(duì)圖標(biāo)中的每一類數(shù)據(jù)進(jìn)項(xiàng)顏色區(qū)分,幫助受眾更直觀地厘清信息之間的區(qū)別。
數(shù)據(jù)新聞的產(chǎn)生基于一個(gè)團(tuán)隊(duì),這個(gè)團(tuán)隊(duì)中必須有四種角色,即記者編輯、數(shù)據(jù)分析師、美術(shù)設(shè)計(jì)師和程序員。內(nèi)容的組織由記者編輯負(fù)責(zé),數(shù)據(jù)的搜集、篩選由數(shù)據(jù)分析師負(fù)責(zé),圖形的設(shè)計(jì)與優(yōu)化由美術(shù)設(shè)計(jì)師負(fù)責(zé),程序員主要負(fù)責(zé)由代碼呈現(xiàn)圖形。而在實(shí)際操作中,往往一個(gè)人會(huì)身兼數(shù)職。
數(shù)據(jù)新聞中數(shù)據(jù)的獲取是通過(guò)政府機(jī)構(gòu)獲得共享數(shù)據(jù),或從非政府機(jī)構(gòu)和企業(yè)那里獲得數(shù)據(jù),很少有新聞媒體是自己搜集數(shù)據(jù)的,一是工程量大,二是數(shù)據(jù)獲取渠道的閉塞和有限。通過(guò)從他人那里獲得數(shù)據(jù)畢竟是有限的,而數(shù)據(jù)新聞?dòng)质怯蓴?shù)據(jù)驅(qū)動(dòng)的,是離不開(kāi)數(shù)據(jù)的,因此,數(shù)據(jù)的獲取成為了數(shù)據(jù)新聞發(fā)展的一個(gè)障礙。
現(xiàn)下的許多數(shù)據(jù)新聞作品中都出現(xiàn)大量的數(shù)據(jù),專業(yè)的做法是對(duì)數(shù)據(jù)的來(lái)源進(jìn)行標(biāo)注,但仍不乏一些新聞媒體對(duì)數(shù)據(jù)來(lái)源不予交代,因?yàn)檫@些數(shù)據(jù)可能來(lái)源于別的媒體報(bào)道之中,也就是來(lái)源于第三者之手,第三者一旦不具有權(quán)威性,就會(huì)使得新聞的說(shuō)服力不強(qiáng)。這樣做一方面會(huì)對(duì)媒體的形象造成損失,降低受眾對(duì)這一媒體的信任度;另一方面,數(shù)據(jù)新聞的邏輯分析經(jīng)由錯(cuò)誤的數(shù)據(jù)得到加深和呈現(xiàn),很有可能會(huì)造成假新聞在受眾之間的傳播。數(shù)據(jù)來(lái)源的真實(shí)性有待查證,無(wú)處可查是當(dāng)下數(shù)據(jù)新聞中存在的一個(gè)弊病。
數(shù)據(jù)新聞不同于新聞數(shù)據(jù),數(shù)據(jù)新聞中的數(shù)據(jù)是海量的,雖然較于傳統(tǒng)的抽樣調(diào)查。具有相對(duì)的“全面性”,但是這么大的數(shù)量必然會(huì)導(dǎo)致一部分?jǐn)?shù)據(jù)不準(zhǔn)確。因此,在此數(shù)據(jù)基礎(chǔ)上進(jìn)行分析也就很難實(shí)現(xiàn)精確,具有一定的模糊性。
數(shù)據(jù)的呈現(xiàn)放大了新聞的議程設(shè)置功能,由于數(shù)據(jù)給受眾的沖擊力是強(qiáng)大的,再加之可視化的呈現(xiàn)方式,使得數(shù)據(jù)新聞所報(bào)道的數(shù)據(jù)之間的邏輯關(guān)系在受眾中得到深化。比如央視的《據(jù)說(shuō)春運(yùn)》一經(jīng)播出 ,受眾就會(huì)對(duì)春運(yùn)形成一種形象的感知,也不容易聽(tīng)得進(jìn)去關(guān)于春運(yùn)相反面的新聞。這無(wú)形中加深和固化了受眾對(duì)我國(guó)春運(yùn)的認(rèn)知基膜。由于數(shù)據(jù)新聞的特性,如果沒(méi)有媒體利用這一特性對(duì)受眾進(jìn)行有目的的議程設(shè)置,后果無(wú)疑是影響巨大。數(shù)據(jù)新聞的呈現(xiàn)在這一方面不利于新聞對(duì)擬態(tài)環(huán)境的客觀塑造。
在數(shù)據(jù)新聞中,數(shù)據(jù)都是客觀存在的,數(shù)據(jù)的分析都是通過(guò)工具實(shí)現(xiàn)的,數(shù)據(jù)新聞就是呈現(xiàn)數(shù)據(jù)分析得出的數(shù)據(jù)之間的相關(guān)關(guān)系,這一切看似對(duì)把關(guān)人的角色是一種淡化,實(shí)際上,數(shù)據(jù)新聞中的把關(guān)人的角色不但沒(méi)有淡化,反而加大。在選題的過(guò)程中就是把關(guān)人出現(xiàn)并履行職責(zé)的時(shí)候,一旦選題出現(xiàn)失誤,報(bào)道就會(huì)引領(lǐng)錯(cuò)誤的價(jià)值觀,導(dǎo)致不良的社會(huì)輿論。同時(shí),在數(shù)據(jù)的篩選、清洗過(guò)程中,數(shù)據(jù)的取舍也是把關(guān)人作用的體現(xiàn),一旦數(shù)據(jù)取舍有誤,失實(shí)的信息大量涌入有效信息容量之中,數(shù)據(jù)的相對(duì)關(guān)系就會(huì)產(chǎn)生相應(yīng)的偏差,這樣會(huì)造成數(shù)據(jù)新聞報(bào)道引領(lǐng)錯(cuò)誤的社會(huì)輿論,對(duì)社會(huì)的正常發(fā)展機(jī)制造成危害。
反之,在數(shù)據(jù)新聞中,把關(guān)人只要稍稍對(duì)數(shù)據(jù)進(jìn)行手腳,就會(huì)造成較大的社會(huì)影響,一旦別有用心的人承擔(dān)把關(guān)人的角色,后果不堪想象。
對(duì)數(shù)據(jù)新聞生產(chǎn)過(guò)程的參與者而言,要加強(qiáng)理論學(xué)習(xí),提高新聞職業(yè)素養(yǎng),同時(shí)還要學(xué)習(xí)多種技能,隨著數(shù)據(jù)新聞的發(fā)展,僅僅只會(huì)采編的記者可能不適應(yīng)技術(shù)性較強(qiáng)的數(shù)據(jù)新聞生產(chǎn),因此,記者要不斷地提高自己的技能。提高新聞職業(yè)素養(yǎng)是新聞從業(yè)者在職業(yè)生涯永恒不變的要求,在數(shù)據(jù)新聞?lì)I(lǐng)域,凡是參與新聞生產(chǎn)的人員都應(yīng)提高新聞職業(yè)素養(yǎng),只有具有較高的職業(yè)素養(yǎng)的人參與到新聞生產(chǎn)的過(guò)程中去,才能更好的履行把關(guān)人的角色,才能在數(shù)據(jù)新聞報(bào)到中做到平衡報(bào)道,追求數(shù)據(jù)新聞作為新聞本身的價(jià)值和意義。
數(shù)據(jù)來(lái)源開(kāi)放共享是解決數(shù)據(jù)來(lái)源、拓展數(shù)據(jù)新聞報(bào)道角度的重要途徑。數(shù)據(jù)一旦開(kāi)放共享,數(shù)據(jù)的失實(shí)和誤差將會(huì)降到最低,大量的數(shù)據(jù)也可以為新聞媒體挖掘數(shù)據(jù)背后不同的相關(guān)關(guān)系,形成豐富的報(bào)道主題。這也可以杜絕某些媒體因獨(dú)占數(shù)據(jù),其他媒體無(wú)法核實(shí)該媒體基于獨(dú)占數(shù)據(jù)的報(bào)道是否合理,而形成的“一言堂”現(xiàn)象。雖然在現(xiàn)階段還不可能實(shí)現(xiàn),但這是數(shù)據(jù)新聞良好發(fā)展的一個(gè)希冀。
數(shù)據(jù)新聞在選擇合適的可視化呈現(xiàn)方式時(shí),要充分考慮受眾的理解程度。數(shù)據(jù)新聞盡管具有可視化的直觀性,但是對(duì)專業(yè)領(lǐng)域的報(bào)道一定要匹配相應(yīng)的通俗的揭示文字,否則非專業(yè)的受眾就會(huì)對(duì)此信息失去閱讀的興趣,本來(lái)直觀的呈現(xiàn)優(yōu)勢(shì)也不存在。即使是非專業(yè)領(lǐng)域的數(shù)據(jù)新聞報(bào)道,也要充分結(jié)合故事性來(lái)敘述,這樣不至于數(shù)據(jù)報(bào)道干澀,沒(méi)有活力。結(jié)合了故事性的數(shù)據(jù)新聞呈現(xiàn)方式既迎合了受眾的理解力,也使得數(shù)據(jù)新聞?dòng)辛缩r活的張力。
數(shù)據(jù)新聞為新聞事業(yè)的發(fā)展注入了新鮮的血液 ,也促進(jìn)了媒介融合的時(shí)代主題,數(shù)據(jù)驅(qū)動(dòng)新聞使得新聞的故事性更加客觀和直觀,對(duì)受眾而言,也符合當(dāng)下快閱讀的習(xí)慣。但是,數(shù)據(jù)新聞還在不斷的摸索中發(fā)展,也存在不少的弊端,給學(xué)界和業(yè)界提出了新的探究課題。