□杜 偉
“大數(shù)據(jù)”建立在互聯(lián)網(wǎng)技術(shù)基礎(chǔ)上,指的是信息量巨大的統(tǒng)計及技術(shù)操作。簡單來說,“大數(shù)據(jù)”其實就是海量資料巨量資料,這些巨量資料來源于世界各地隨時產(chǎn)生的數(shù)據(jù)。
在“大數(shù)據(jù)”時代,任何微小的數(shù)據(jù)都可能產(chǎn)生不可思議的價值?!按髷?shù)據(jù)”有4個特點,為別為:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值),一般被稱之為4V。
大數(shù)據(jù)的特征首先就體現(xiàn)為“大”。隨著時間的推移,存儲單位從過去的GB到TB,乃至現(xiàn)在的PB、EB級別。隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)開始爆發(fā)式增長。社交網(wǎng)絡(luò)(微博、推特、臉書)、移動網(wǎng)絡(luò)、智能工具、服務(wù)工具等,都成為數(shù)據(jù)的來源。迫切需要智能的算法、強大的數(shù)據(jù)處理平臺和新的數(shù)據(jù)處理技術(shù),來統(tǒng)計、分析、預(yù)測和實時處理如此大規(guī)模的數(shù)據(jù)。
廣泛的數(shù)據(jù)來源,決定了大數(shù)據(jù)形式的多樣性。任何形式的數(shù)據(jù)都可以產(chǎn)生作用,目前應(yīng)用最廣泛的就是推薦系統(tǒng)。日志數(shù)據(jù)是結(jié)構(gòu)化明顯的數(shù)據(jù),還有一些數(shù)據(jù)結(jié)構(gòu)化不明顯,例如圖片、音頻、視頻等,這些數(shù)據(jù)因果關(guān)系弱,就需要人工對其進(jìn)行標(biāo)注。
大數(shù)據(jù)的產(chǎn)生非常迅速,主要通過互聯(lián)網(wǎng)傳輸。生活中每個人都離不開互聯(lián)網(wǎng),也就是說每個人每天都在向大數(shù)據(jù)提供大量的資料,并且這些數(shù)據(jù)是需要及時處理的。大數(shù)據(jù)對處理速度有非常嚴(yán)格的要求,服務(wù)器中大量的資源都用于處理和計算數(shù)據(jù),很多平臺都需要做到實時分析。數(shù)據(jù)無時無刻不在產(chǎn)生,誰的速度更快,誰就有優(yōu)勢。
這也是大數(shù)據(jù)的核心特征。現(xiàn)實世界所產(chǎn)生的數(shù)據(jù)中,有價值的數(shù)據(jù)所占比例很小。相比于傳統(tǒng)的小數(shù)據(jù),大數(shù)據(jù)最大的價值在于通過從大量不相關(guān)的各種類型的數(shù)據(jù)中,挖掘出對未來趨勢與模式預(yù)測分析有價值的數(shù)據(jù),并通過機器學(xué)習(xí)方法、人工智能方法或數(shù)據(jù)挖掘方法深度分析,發(fā)現(xiàn)新規(guī)律和新知識,并運用于新聞等各個領(lǐng)域。
“大數(shù)據(jù)”時代的到來,改變了人們?nèi)粘5纳詈凸ぷ鞣绞?,對企業(yè)經(jīng)營、媒體傳播及政府管理有重要意義。應(yīng)該如何去對“大數(shù)據(jù)”加以分析和運用值得我們思考。
在“大數(shù)據(jù)”時代下,人們可以迅速得到實時發(fā)生的信息,能夠?qū)ξ磥砜赡馨l(fā)生的事進(jìn)行預(yù)測并對突發(fā)事件進(jìn)行有效防范。對新聞媒體而言,運用好“大數(shù)據(jù)”也很重要。它有助于新聞媒體工作人員迅速獲取信息,第一時間將信息傳播出去。
世界上的任何事物都是具有兩面性的,“大數(shù)據(jù)”也不例外。
“大數(shù)據(jù)”的積極作用在于:如果能夠科學(xué)、合理地使用“大數(shù)據(jù)”,那么就能推動社會科學(xué)和經(jīng)濟的發(fā)展。然而,實現(xiàn)這一目標(biāo)和任務(wù)并不容易,需要廣大新聞工作者的共同努力。顯然,現(xiàn)在很多大眾媒體或社交媒體都應(yīng)用了“大數(shù)據(jù)“技術(shù)。科學(xué)地發(fā)展“大數(shù)據(jù)”產(chǎn)業(yè),實現(xiàn)“大數(shù)據(jù)”的積極作用,將會為人們的生活和工作帶來巨大益處。
當(dāng)然,“大數(shù)據(jù)”也有一定的消極影響,實際上“大數(shù)據(jù)”并不是萬能的,如果過度地依賴“大數(shù)據(jù)”技術(shù)而忽略其他信息技術(shù)的話,將造成傳播信息方式單一。要想有所建樹,就一定要保持理智,對“大數(shù)據(jù)”進(jìn)行理性分析,使它能夠為新聞行業(yè)服務(wù),提高工作效率。一定要冷靜對待“大數(shù)據(jù)”,需從技術(shù)、法律等多方面降低新技術(shù)產(chǎn)生的負(fù)面效應(yīng)。
此外,數(shù)據(jù)安全利用和隱私保護(hù)是目前大數(shù)據(jù)商業(yè)化的一大挑戰(zhàn),我們必須重視這個問題,進(jìn)一步加強和規(guī)范科學(xué)數(shù)據(jù)管理,保障科學(xué)數(shù)據(jù)安全,提高開放共享水平。
現(xiàn)在的新聞信息可以說是海量的,更新速度極快,新聞媒體對這些新聞信息的獲取基本上是通過“大數(shù)據(jù)”技術(shù),這些技術(shù)確保新聞工作者可以源源不斷地接收新聞信息,并有效進(jìn)行分析、判斷。新聞媒體對這些龐大的新聞信息一定要學(xué)會整理和取舍。新聞信息不斷產(chǎn)生,如何在繁雜的新聞信息中找尋到新聞媒體需要的信息值得我們思考。一起事件是否能成為新聞、值不值得報道,依據(jù)的不僅僅是“大數(shù)據(jù)”,更重要的是要根據(jù)新聞價值作出判斷,這就需要新聞工作者提高新聞判斷力。
此外,記者若想對一起新聞事件進(jìn)行完整的報道,就需要對這起事件從不同角度展開調(diào)查,全面分析才能形成一個完整的故事,這同樣也要依據(jù)“大數(shù)據(jù)”技術(shù)。數(shù)據(jù)庫可以幫助記者搜索與此新聞事件相關(guān)聯(lián)的背景等數(shù)據(jù)信息。當(dāng)然,一個優(yōu)秀的新聞報道是不能僅僅依靠“大數(shù)據(jù)”技術(shù)的,新聞媒體可以對關(guān)鍵新聞點進(jìn)行深入思考并寫出獨家評論,這才是競爭制勝的法寶。
綜上所述,如今“大數(shù)據(jù)”已經(jīng)被廣泛應(yīng)用到人們的日常生活、工作中,雖然“大數(shù)據(jù)”技術(shù)的發(fā)展還不夠完善,數(shù)據(jù)庫也不完整,新聞行業(yè)對“大數(shù)據(jù)”技術(shù)成功運用的實際案例也不多,但是從長遠(yuǎn)的角度來看,要是新聞行業(yè)及其他行業(yè)都能夠科學(xué)、合理地運用“大數(shù)據(jù)”技術(shù),并對它進(jìn)行創(chuàng)新,那么有朝一日,“大數(shù)據(jù)”技術(shù)肯定能夠使人類社會發(fā)生翻天覆地的變化。因此,討論新聞媒體如何駕馭好“大數(shù)據(jù)”具有十分重要的現(xiàn)實意義。