陳秀慧
摘 要 大數(shù)據(jù)帶來(lái)的變革為人類社會(huì)烙下了深刻的印記,它重塑了人們工作、生活和思考的方式。大數(shù)據(jù)技術(shù)的應(yīng)用已經(jīng)滲透到各行各業(yè)中,許多行業(yè)也由此呈現(xiàn)出新的發(fā)展模式和發(fā)展方向。在新聞行業(yè)中,大數(shù)據(jù)不僅催生了新的新聞?lì)愋?,也給新聞的生產(chǎn)和編輯、傳播帶來(lái)了新的變革,對(duì)新聞從業(yè)者的素質(zhì)提出了更高的要求,把新聞中的事實(shí)與真相訴諸數(shù)據(jù)采集與挖掘篩選,把理性與情感訴諸數(shù)據(jù)解讀,從大數(shù)據(jù)中洞察社會(huì),感知社會(huì)情緒。在大數(shù)據(jù)蓬勃發(fā)展的時(shí)代,新聞行業(yè)及從業(yè)者應(yīng)該正視并利用好數(shù)據(jù)挖掘和可視化等技術(shù)在媒介用戶交互中的重要作用??梢暬c交互性將極大放大媒介作用,也將成為今后媒介發(fā)展的重要方向。
關(guān)鍵詞 大數(shù)據(jù);數(shù)據(jù)挖掘;數(shù)據(jù)新聞;可視化
中圖分類號(hào) G2 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-0360(2018)06-0036-02
時(shí)至今日,互聯(lián)網(wǎng)上生產(chǎn)、存儲(chǔ)、積累的數(shù)據(jù)量之大,已經(jīng)超越了一般人所能想象的范圍。數(shù)據(jù)不僅能讓人們掌握歷史信息,還能幫助人們更好地預(yù)測(cè)未來(lái)變遷。由大數(shù)據(jù)支持的新聞報(bào)道,更能從社會(huì)表層現(xiàn)實(shí)進(jìn)行深入,進(jìn)一步發(fā)掘社會(huì)深層現(xiàn)實(shí),提升報(bào)道深度??梢暬侣剶⑹履J揭哺m應(yīng)用戶對(duì)于感性認(rèn)知和理性認(rèn)知的需求,而媒體的身份在這一過(guò)程中也從客觀的平臺(tái)搭建者和信息收集者進(jìn)一步深化為社會(huì)意義的生成者。對(duì)于媒體行業(yè)發(fā)展而言,大數(shù)據(jù)的挖掘與分析能力關(guān)乎核心競(jìng)爭(zhēng)力的培育。
1 大數(shù)據(jù)和大數(shù)據(jù)技術(shù)
作為統(tǒng)計(jì)學(xué)量的數(shù)對(duì)于每個(gè)人而言并不陌生。在計(jì)算機(jī)誕生以后,信息產(chǎn)生的速度不斷加快,信息總量不斷增加,達(dá)到足以引發(fā)質(zhì)變的程度。最先經(jīng)歷信息爆炸的基因?qū)W、天文學(xué)等學(xué)科,創(chuàng)造了“大數(shù)據(jù)”這一概念。今時(shí)今日,大數(shù)據(jù)的概念幾乎已經(jīng)延伸、滲透到了所有學(xué)科和行業(yè)中。
大數(shù)據(jù)技術(shù)則是建立在Web2.0背景下,以數(shù)據(jù)挖掘?yàn)榛A(chǔ),對(duì)海量數(shù)據(jù)進(jìn)行處理、分析、分享的技術(shù)。主要也可以區(qū)分為以下幾種主要技術(shù):數(shù)據(jù)采集、存儲(chǔ)、清洗、挖掘和可視化。從新聞業(yè)務(wù)角度來(lái)說(shuō),大數(shù)據(jù)技術(shù)是集采集、查詢、分析處理、可視化呈現(xiàn)等手段于一體的實(shí)務(wù)技術(shù)[1],其發(fā)展和應(yīng)用對(duì)新聞生產(chǎn)及傳播的各環(huán)節(jié)都產(chǎn)生重要影響。
2 新聞采寫中的大數(shù)據(jù)技術(shù)應(yīng)用
采訪是新聞報(bào)道的基礎(chǔ),是記者獲取信息的重要途徑。大數(shù)據(jù)技術(shù)對(duì)于新聞采訪的影響主要體現(xiàn)在進(jìn)行采訪前的準(zhǔn)備、策劃階段,具體表現(xiàn)在新聞熱點(diǎn)預(yù)測(cè)捕捉、采訪前期資料準(zhǔn)備的便利上。而其對(duì)于新聞寫作的影響,則主要體現(xiàn)在宏觀龐大的事件呈現(xiàn)視角上,記者可以從數(shù)據(jù)的橫縱向?qū)Ρ然蚝暧^數(shù)據(jù)規(guī)律的角度入手進(jìn)行寫作或行文構(gòu)思。
熱點(diǎn)的預(yù)測(cè)捕捉和數(shù)據(jù)抓取收集給新聞內(nèi)容設(shè)計(jì)帶來(lái)了諸多便利。具體可以分為兩種方式。一種是實(shí)時(shí)監(jiān)控詞頻以達(dá)到熱點(diǎn)預(yù)測(cè),另一種則是建立媒體資源數(shù)據(jù)庫(kù)。國(guó)外社交數(shù)據(jù)平臺(tái)Data Sift正是抓住社交媒體的實(shí)時(shí)動(dòng)態(tài)監(jiān)控這一巨大需求,對(duì)推特等社交媒體上的海量社交數(shù)據(jù)進(jìn)行分析,向品牌公司、傳統(tǒng)企業(yè)、金融市場(chǎng)、新聞機(jī)構(gòu)等提供實(shí)時(shí)或歷史社交數(shù)據(jù)。同時(shí),媒體通過(guò)收錄過(guò)往的全部報(bào)道資源,建立資源數(shù)據(jù)庫(kù),能極大方便記者進(jìn)行相關(guān)資源搜索。對(duì)于會(huì)議新聞、政策文件等,也可以通過(guò)文本分析功能,如詞頻分析,來(lái)揭示其重要程度,幫助媒體進(jìn)行政策解讀。
而在數(shù)據(jù)采集過(guò)程中,媒體利用問卷等形式加強(qiáng)平臺(tái)與用戶之間的互動(dòng),以UGC的形式增強(qiáng)用戶黏性。向受眾“要”數(shù)據(jù),再用大量的統(tǒng)計(jì)數(shù)據(jù)和可視化的生動(dòng)展現(xiàn)方式,把數(shù)據(jù)整合之后反饋給受眾,能讓受眾更好地體會(huì)新聞情景、感受新聞場(chǎng)景。大數(shù)據(jù)時(shí)代對(duì)于新聞從業(yè)者和行業(yè)的發(fā)展提出了更高的要求,不僅能收集數(shù)據(jù),也要能夠整合和處理數(shù)據(jù),還要通過(guò)對(duì)大數(shù)據(jù)的分析更好的洞察對(duì)社會(huì)的影響,感知社會(huì)情緒。甚至可以說(shuō),大數(shù)據(jù)時(shí)代更新了許多人對(duì)新聞傳播領(lǐng)域的認(rèn)識(shí),同時(shí)也對(duì)行業(yè)提出了新的挑戰(zhàn)。完全由數(shù)據(jù)和程序化、模板化的報(bào)道方式構(gòu)成的新聞,或者經(jīng)由機(jī)器采寫發(fā)布的新聞,是空洞、缺乏人文關(guān)懷的,亦很難談得上是未來(lái)新聞業(yè)發(fā)展的趨勢(shì)。
3 新聞編輯中的大數(shù)據(jù)技術(shù)應(yīng)用
在更加注重用戶體驗(yàn)的當(dāng)下,媒體利用后臺(tái)數(shù)據(jù)描摹用戶畫像并進(jìn)行精準(zhǔn)內(nèi)容推送,在很大程度上弱化了新聞編輯的作用,用戶也更容易陷入“信息繭房”,相關(guān)研究近來(lái)也備受關(guān)注。本文所討論的“新聞編輯”更側(cè)重于單個(gè)新聞作品中的信息編輯呈現(xiàn)。其中,新聞數(shù)據(jù)的呈現(xiàn)包括展示數(shù)據(jù)和解讀數(shù)據(jù)兩部分。其中,展示數(shù)據(jù)主要通過(guò)數(shù)據(jù)可視化來(lái)實(shí)現(xiàn)??梢暬饕菍?shù)值型的數(shù)據(jù)及數(shù)據(jù)間的內(nèi)在聯(lián)系視覺化的手段,主要的轉(zhuǎn)化呈現(xiàn)方式為圖片、動(dòng)畫等[2]??梢暬芮逦庇^地解釋數(shù)據(jù)內(nèi)在錯(cuò)綜復(fù)雜的關(guān)系,使受眾在一定的情景背景中理解新聞事件,從而更能深刻地理解事件的發(fā)展以及背后的意義[3]。解讀數(shù)據(jù)主要指對(duì)數(shù)據(jù)分析后得出的規(guī)律、結(jié)果和有價(jià)值信息的說(shuō)明,以及對(duì)于數(shù)據(jù)可視化呈現(xiàn)后的輔助解釋。數(shù)據(jù)的解讀不同于新聞圖片的注釋及新聞畫面的配發(fā)文字,它需要更多地引導(dǎo)受眾完成對(duì)新聞的理解,因此需要新聞從業(yè)者具有扎實(shí)的文字功底、清晰的邏輯思路以及豐富的閱歷積累。
大數(shù)據(jù)技術(shù)對(duì)新聞呈現(xiàn)方式產(chǎn)生的最直觀也最主要的影響,就是數(shù)據(jù)新聞(data journalism)的產(chǎn)生與崛起。倫敦城市大學(xué)新聞系的客座教授保羅·布拉德肖在其網(wǎng)絡(luò)新聞博客上發(fā)表的《數(shù)據(jù)新聞生產(chǎn)的倒金字塔結(jié)構(gòu)》中,把數(shù)據(jù)新聞采寫具體化為4個(gè)步驟,包括數(shù)據(jù)匯編、數(shù)據(jù)整理、數(shù)據(jù)編輯和數(shù)據(jù)整合。這4個(gè)部分整體上呈倒金字塔結(jié)
構(gòu)[1]。完成數(shù)據(jù)新聞的數(shù)據(jù)處理后,即要進(jìn)行傳播。數(shù)據(jù)新聞的傳播則包括6個(gè)步驟,即數(shù)據(jù)的可視化、敘述化、社交化、人性化、個(gè)性化和可使用化,這6個(gè)部分在整體上則呈正金字塔結(jié)構(gòu)。
目前,我國(guó)的數(shù)據(jù)新聞多采用靜態(tài)信息圖表的方式來(lái)呈現(xiàn),形式較為趨同,雖在美工方面十分用心,但可視化程度較弱,展現(xiàn)形式單一,多為海報(bào)形式。此類數(shù)據(jù)新聞的用戶參與度較低,交互性不夠,至多能在兩個(gè)數(shù)據(jù)圖表之間進(jìn)行點(diǎn)擊切換,少有關(guān)鍵詞查詢等功能。國(guó)外先進(jìn)媒體則更注重?cái)?shù)據(jù)交互性。如英國(guó)《衛(wèi)報(bào)》的“阿拉伯之春”專題以圖片的形式梳理了“阿拉伯之春”爆發(fā)以后的重要事件結(jié)點(diǎn)和各方回應(yīng),方便用戶進(jìn)行查詢。相較之下,國(guó)內(nèi)門戶網(wǎng)站的數(shù)據(jù)新聞可視化還有很多提升空間[4]。
4 結(jié)束語(yǔ)
大數(shù)據(jù)技術(shù)是信息時(shí)代重要的能量“寶藏”,哪個(gè)行業(yè)能最有效地從大數(shù)據(jù)技術(shù)中挖掘價(jià)值,哪個(gè)行業(yè)就能獲得這個(gè)時(shí)代最強(qiáng)大的生產(chǎn)力。雖然大數(shù)據(jù)在某種程度上抹殺了個(gè)體的獨(dú)特性,每個(gè)人的身份都“數(shù)字化”了,掌握數(shù)據(jù)者和不掌握數(shù)據(jù)者之間存在巨大數(shù)據(jù)技術(shù)鴻溝也會(huì)導(dǎo)致財(cái)富鴻溝和權(quán)利鴻溝的出現(xiàn)。但不可否認(rèn)的是,大數(shù)據(jù)在諸多行業(yè)的應(yīng)用為我們的生活帶來(lái)了許多便利,大數(shù)據(jù)在新聞內(nèi)容生產(chǎn)及編輯設(shè)計(jì)中的應(yīng)用越發(fā)廣泛,給新聞行業(yè)發(fā)展帶來(lái)了新的挑戰(zhàn),也帶來(lái)了更多新的機(jī)遇和可能性,更加交互化和可視化必定是新聞發(fā)展的重要方向。
總而言之,大數(shù)據(jù)技術(shù)作為技術(shù)本身,是一把雙刃劍。在大數(shù)據(jù)時(shí)代下,新聞內(nèi)容設(shè)計(jì)及新聞從業(yè)者有了新的發(fā)展需求,大數(shù)據(jù)技術(shù)對(duì)于新聞行業(yè)的影響正逐步顯現(xiàn),目前學(xué)界對(duì)其影響的研究才剛剛展開,本文單從新聞生產(chǎn)編輯這一小處著手,希望可以管中窺豹,以小見大,映射出大數(shù)據(jù)技術(shù)對(duì)于整個(gè)新聞行業(yè)的深刻影響變革。文中的部分觀點(diǎn)尚待實(shí)踐檢驗(yàn),望批評(píng)斧正。
參考文獻(xiàn)
[1]趙毅.大數(shù)據(jù)技術(shù)對(duì)新聞業(yè)務(wù)的影響研究[D].大連:大連理工大學(xué),2015.
[2]喻國(guó)明,劉界儒,李陽(yáng).數(shù)據(jù)新聞現(xiàn)存的問題與解決之道——兼論人工智能的應(yīng)用價(jià)值[J].新聞愛好者,2017(6):4-7.
[3]郭欽.數(shù)據(jù)新聞:大數(shù)據(jù)時(shí)代新聞報(bào)道新模式[D].武漢:華中師范大學(xué),2014.
[4]閆崇.大數(shù)據(jù)支持下的數(shù)據(jù)新聞生產(chǎn)方式研究[D].濟(jì)南:山東師范大學(xué),2016.