孫詩(shī)雨
摘 要 隨著互聯(lián)網(wǎng)和云計(jì)算等技術(shù)的發(fā)展,大數(shù)據(jù)時(shí)代也隨之到來(lái),但目前由于人們對(duì)大數(shù)據(jù)的認(rèn)知不清導(dǎo)致了其對(duì)大數(shù)據(jù)的盲目崇拜,一味陷入大數(shù)據(jù)的漩渦之中,對(duì)大數(shù)據(jù)沒(méi)有做到理性審視。本文從大數(shù)據(jù)概念的探討,大數(shù)據(jù)的價(jià)值分析、大數(shù)據(jù)處理流程中的短板以及大數(shù)據(jù)之于新聞傳播的影響4個(gè)方面來(lái)分析大數(shù)據(jù),肯定了其價(jià)值,指出了其不足,以期人們能全面認(rèn)識(shí)大數(shù)據(jù),從而更好地利用大數(shù)據(jù),讓大數(shù)據(jù)發(fā)揮出更大的價(jià)值。
關(guān)鍵詞 大數(shù)據(jù);價(jià)值;短板;新聞傳播;技術(shù)
中圖分類號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2017)189-0077-04
近兩年來(lái),大數(shù)據(jù)的浪潮愈演愈烈,“大數(shù)據(jù)”這個(gè)名詞也在各種場(chǎng)合被人們頻繁提起。在2017年兩會(huì)中,就有許多政協(xié)委員和人大代表提到了大數(shù)據(jù),并呼吁要利用好大數(shù)據(jù)來(lái)推動(dòng)社會(huì)發(fā)展,像全國(guó)人大代表、浪潮集團(tuán)董事長(zhǎng)孫丕恕就在一次50分鐘的訪談中94次提到“大數(shù)據(jù)”。
不難發(fā)現(xiàn),當(dāng)今社會(huì),大數(shù)據(jù)技術(shù)有著眾多的追隨者,我們儼然處于大數(shù)據(jù)時(shí)代下的狂歡之中。所以,理性審視大數(shù)據(jù)顯得尤為重要。
目前關(guān)于大數(shù)據(jù),筆者認(rèn)為主要有兩方面的問(wèn)題,即迷惘與迷信。所謂迷惘,即不知什么是真正的大數(shù)據(jù);大數(shù)據(jù)的價(jià)值空間在哪,特別是對(duì)新聞傳播的價(jià)值;國(guó)家大力提倡和業(yè)界回應(yīng)間是否對(duì)應(yīng)等。所謂迷信,一是體現(xiàn)為學(xué)術(shù)研究凡事都扯上大數(shù)據(jù),這一點(diǎn)從中國(guó)知網(wǎng)上關(guān)于“大數(shù)據(jù)”的論文基本涉及各個(gè)領(lǐng)域(教育、醫(yī)療、電力等)就能體現(xiàn)出來(lái);二是各地方政府和職能機(jī)關(guān)也動(dòng)輒以大數(shù)據(jù)為制定政策的依據(jù)和出發(fā)點(diǎn)。
1 “大數(shù)據(jù)”概念還沒(méi)有公認(rèn)的界定
其實(shí),“大數(shù)據(jù)”這個(gè)概念由來(lái)已久。不過(guò)大數(shù)據(jù)真正受到各行各業(yè)的關(guān)注是在2011年6月麥肯錫公司發(fā)布關(guān)于“大數(shù)據(jù)”的報(bào)告之后,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)?!敝袊?guó)對(duì)大數(shù)據(jù)的關(guān)注也是從2011開(kāi)始的,另外,近幾年中國(guó)開(kāi)始召開(kāi)論壇會(huì)議像大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)應(yīng)用大會(huì)等也讓“大數(shù)據(jù)熱”持續(xù)升溫。
不過(guò),在當(dāng)下,人們對(duì)大數(shù)據(jù)的態(tài)度卻陷入一種盲目崇拜的漩渦之中,很多人在對(duì)大數(shù)據(jù)認(rèn)知模糊的時(shí)候就成了它的狂熱粉絲。其實(shí)到目前為止,大數(shù)據(jù)還沒(méi)有一個(gè)統(tǒng)一的定義。大數(shù)據(jù)的鼻祖舍恩伯格在解釋大數(shù)據(jù)時(shí)也沒(méi)有給出一個(gè)確切的描述,“大數(shù)據(jù)是人們獲得新的認(rèn)知、創(chuàng)造新的價(jià)值的源泉;大數(shù)據(jù)還是改變市場(chǎng)、組織機(jī)構(gòu),以及政府與公民關(guān)系的方法?!盵1]這是他在書中的一段詮釋,具有人文色彩和社會(huì)意義,因此,對(duì)于大數(shù)據(jù)概念的界定要看研究者從哪個(gè)角度來(lái)研究它而定。正是大數(shù)據(jù)概念的這種不確定性,使得人們對(duì)其充滿了想象,進(jìn)而把它神化。
目前國(guó)內(nèi)外的專家學(xué)者對(duì)大數(shù)據(jù)的準(zhǔn)確定義給出的結(jié)論不一。在舍恩伯格提出大數(shù)據(jù)的概念之后,關(guān)于大數(shù)據(jù)概念的研究層出不窮,國(guó)內(nèi)外的專家學(xué)者、科研機(jī)構(gòu)甚至是企業(yè)家們都對(duì)大數(shù)據(jù)表達(dá)了一定的見(jiàn)解。中國(guó)學(xué)者王岑嵐和尤建新將現(xiàn)在國(guó)內(nèi)外已有的大數(shù)據(jù)的定義分為四類,基本涵蓋了國(guó)內(nèi)外學(xué)者以及機(jī)構(gòu)對(duì)大數(shù)據(jù)概念的論述,分別是屬性定義、來(lái)源定義、比較定義以及構(gòu)架定義。屬性定義以Gartner機(jī)構(gòu)為代表,主要是從大數(shù)據(jù)特征的角度來(lái)解釋大數(shù)據(jù)的概念,最后慢慢發(fā)展成為目前公認(rèn)的大數(shù)據(jù)的“4V(數(shù)據(jù)容量大(Volume)、數(shù)據(jù)類型繁多(Variety)、商業(yè)價(jià)值高(Value)、處理速度快(Velocity))”特點(diǎn),不過(guò)這幾年國(guó)內(nèi)外的專家學(xué)者又提出了可視性(Visualization)、合法性(Validity)、真實(shí)(Veracity)等新的特征,現(xiàn)在這些新提法也正在探討之中;來(lái)源定義是從人、機(jī)、物三個(gè)維度來(lái)談的;比較定義很好理解,即通過(guò)和傳統(tǒng)數(shù)據(jù)的比較來(lái)解析大數(shù)據(jù)的定義;構(gòu)架定義是把大數(shù)據(jù)分為大數(shù)據(jù)科學(xué)和大數(shù)據(jù)構(gòu)架從而進(jìn)行闡釋的。雖然作者在這篇文章中提煉出了大數(shù)據(jù)概念的共通之處,即“大數(shù)據(jù)是指人類能夠獲取的完整的、動(dòng)態(tài)的、事實(shí)的數(shù)據(jù)流,具有容量高,速度快,結(jié)構(gòu)復(fù)雜的特點(diǎn),只有在充分合理利用的情況下才有可能發(fā)揮其高價(jià)值和準(zhǔn)確性的特點(diǎn)?!盵2]但是,筆者認(rèn)為把這段話當(dāng)做是大數(shù)據(jù)的定義還是遠(yuǎn)遠(yuǎn)不夠的。
大數(shù)據(jù)和傳統(tǒng)意義上的數(shù)據(jù)相比,多了一個(gè)“大”字,但是這個(gè)“大”字的界定是沒(méi)有具體的統(tǒng)一的指標(biāo)的,很多學(xué)者也表示大數(shù)據(jù)這種數(shù)據(jù)集“沒(méi)有最好只有更好”,所以大數(shù)據(jù)是沒(méi)有衡量標(biāo)準(zhǔn)的。雖然從簡(jiǎn)單意義上來(lái)看,大數(shù)據(jù)是指所有的數(shù)據(jù),這也是很多人對(duì)大數(shù)據(jù)的理解;但是在當(dāng)下,大數(shù)據(jù)的內(nèi)容并不能包含所有的數(shù)據(jù),它無(wú)法達(dá)到信息飽和,只能說(shuō)它的終極目標(biāo)是無(wú)窮化。所以,在我看來(lái),大數(shù)據(jù)與傳統(tǒng)意義上的數(shù)據(jù)的本質(zhì)上是沒(méi)有差別的,它們都屬于數(shù)據(jù)信息,都需要對(duì)獲取來(lái)的數(shù)據(jù)進(jìn)行“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”。
大數(shù)據(jù)的挖掘、獲取和處理是需要特殊的技術(shù)支持的,云計(jì)算就是其中一種重要的技術(shù),它和大數(shù)據(jù)的關(guān)系密不可分。但是目前對(duì)云計(jì)算的解釋也有很多種,所以這就讓人們對(duì)大數(shù)據(jù)的概念更加捉摸不透,在不知不覺(jué)中給大數(shù)據(jù)戴上了神秘的面紗。
2 大數(shù)據(jù)的價(jià)值:應(yīng)然與實(shí)然的差距
雖然,大數(shù)據(jù)的概念具有模糊性,但是其價(jià)值仍舊能夠凸顯出來(lái)。上文提到的“4V”特點(diǎn)就彰顯了大數(shù)據(jù)存在的價(jià)值。大數(shù)據(jù)提高了人們記錄和采集相關(guān)信息的能力,將海量數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,從而輔助我們?cè)诟鱾€(gè)領(lǐng)域做出決策,有利于人們發(fā)現(xiàn)事物的規(guī)律,進(jìn)行趨勢(shì)預(yù)測(cè),所以其價(jià)值有目共睹。
清華大學(xué)信息技術(shù)研究院的研究員薛一波指出,“大數(shù)據(jù)的科學(xué)價(jià)值和社會(huì)價(jià)值主要體現(xiàn)在兩個(gè)方面:一方面,大數(shù)據(jù)不僅可以發(fā)現(xiàn)事物的顯式規(guī)律,而且可以挖掘事物的隱式規(guī)律和潛在價(jià)值;另一方面,大數(shù)據(jù)可以轉(zhuǎn)化為經(jīng)濟(jì)價(jià)值的源泉,撼動(dòng)世界的各個(gè)方面?!盵3]他在文中沒(méi)有著重分析“科學(xué)價(jià)值”和“社會(huì)價(jià)值”的內(nèi)涵,但筆者認(rèn)為這兩個(gè)提法可以用來(lái)分析大數(shù)據(jù)所帶來(lái)的價(jià)值。
人們對(duì)科學(xué)價(jià)值的關(guān)注度很低,因?yàn)樗芷陂L(zhǎng),基本都處于潛在價(jià)值的范圍之內(nèi),但是科學(xué)價(jià)值是大數(shù)據(jù)價(jià)值非常重要的一環(huán),它主要通過(guò)對(duì)大數(shù)據(jù)及其技術(shù)的研究所產(chǎn)生來(lái)實(shí)現(xiàn)的,大數(shù)據(jù)研究的熱潮激勵(lì)基礎(chǔ)研究的科研人員更加關(guān)注“數(shù)據(jù)科學(xué)”問(wèn)題,這有望使得大數(shù)據(jù)的技術(shù)越來(lái)越純熟,更好地發(fā)揮大數(shù)據(jù)預(yù)測(cè)的核心價(jià)值,讓大數(shù)據(jù)更好地為人所用。
至于社會(huì)價(jià)值,筆者是基于廣義的社會(huì)價(jià)值進(jìn)行分析的,包括政治價(jià)值、經(jīng)濟(jì)價(jià)值、文化價(jià)值等各種社會(huì)構(gòu)成元素的價(jià)值。其中,經(jīng)濟(jì)價(jià)值目前體現(xiàn)得最明顯,為人所津津樂(lè)道,“4V”特點(diǎn)中也直接提到了大數(shù)據(jù)商業(yè)價(jià)值高,它能創(chuàng)造巨大的利潤(rùn),有利于細(xì)分市場(chǎng)和精準(zhǔn)營(yíng)銷,滿足更多的顧客的需求。其次就是大數(shù)據(jù)給社會(huì)生活帶來(lái)的便利,在治安、交通、醫(yī)療等生活領(lǐng)域,大數(shù)據(jù)都發(fā)揮著重要的作用。以交通為例,大數(shù)據(jù)可通過(guò)對(duì)公交地鐵刷卡、停車收費(fèi)站、視頻攝像頭等信息的收集,分析預(yù)測(cè)出行交通規(guī)律,指導(dǎo)公交線路的設(shè)計(jì)、調(diào)整車輛派遣密度,進(jìn)行車流指揮控制,及時(shí)做到梳理?yè)矶?,合理緩解城市交通?fù)擔(dān)。在2017年3月27日,高德地圖發(fā)布了《2017年清明節(jié)出行預(yù)測(cè)報(bào)告》,就是運(yùn)用了大數(shù)據(jù)預(yù)測(cè),為人們提供了假期出行福利。
然而在當(dāng)下的中國(guó),大數(shù)據(jù)的價(jià)值并沒(méi)有充分發(fā)揮,究其原因,主要包括制度限制、心理障礙以及技術(shù)問(wèn)題這3個(gè)方面。技術(shù)問(wèn)題包含在下一部分“大數(shù)據(jù)處理流程中的短板”中,在此就不做贅述,以下分析前兩個(gè)問(wèn)題。
一是制度限制。近幾年對(duì)大數(shù)據(jù)的研究層出不窮,國(guó)家也十分鼓勵(lì)關(guān)于大數(shù)據(jù)的研究項(xiàng)目,這一點(diǎn)從國(guó)家社科基金年度項(xiàng)目的立項(xiàng)名單中就可以看出來(lái):2014年國(guó)家社科基金年度項(xiàng)目有2776項(xiàng)立項(xiàng),其中27項(xiàng)戴了“大數(shù)據(jù)”的帽子。占比0.97%。2015年國(guó)家社科基金年度項(xiàng)目有2752項(xiàng)立項(xiàng),其中43項(xiàng)戴了“大數(shù)據(jù)”的帽子。占比1.56%。2016年國(guó)家社科基金年度項(xiàng)目有2857項(xiàng)立項(xiàng),其中58項(xiàng)戴了“大數(shù)據(jù)”的帽子。占比2.03%。這些數(shù)據(jù)反映了關(guān)于大數(shù)據(jù)的研究越來(lái)越得到國(guó)家和政府的重視,國(guó)家對(duì)此投入的成本也是逐年
增加。
此外,我國(guó)已有21個(gè)省份出臺(tái)了大數(shù)據(jù)規(guī)劃政策;遼寧沈陽(yáng)、甘肅蘭州等多個(gè)省市成立了大數(shù)據(jù)管理局;各省市引導(dǎo)建設(shè)大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟20余個(gè)[4]。從中同樣可以看出,國(guó)家和政府對(duì)大數(shù)據(jù)的投資很大,而且投入的成本越來(lái)越高。
一些發(fā)達(dá)的西方國(guó)家相較中國(guó),起步早,發(fā)展迅速且完備,就以美國(guó)為例,美國(guó)政府將大數(shù)據(jù)視為強(qiáng)化美國(guó)競(jìng)爭(zhēng)力的關(guān)鍵因素之一,把大數(shù)據(jù)研究和生產(chǎn)計(jì)劃提高到國(guó)家戰(zhàn)略層面。除此之外,美國(guó)政府積極推動(dòng)數(shù)據(jù)公開(kāi),所以美國(guó)的大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)創(chuàng)造了巨大的價(jià)值。
而在中國(guó),大數(shù)據(jù)主要是用于政府管理和社會(huì)科學(xué)的研究,以此作為制定決策的基本要素之一。但政府掌握著大量核心數(shù)據(jù),并且數(shù)據(jù)利用率較低,由于制度的限制,如以不公開(kāi)為立法取向的法律(《政府信息公開(kāi)條例》的法律效力低于《保守國(guó)家秘密法》《檔案法》等以信息保密為立法取向的法律)、政府職權(quán)的條塊分割等,使得占數(shù)據(jù)總量95%以上的非結(jié)構(gòu)化數(shù)據(jù)被束之高閣;一些平臺(tái)和社會(huì)力量擁有大量的數(shù)據(jù),無(wú)法將之應(yīng)用到更大的領(lǐng)域發(fā)揮更大的價(jià)值;一些企業(yè)擁有專業(yè)數(shù)據(jù)分析應(yīng)用技術(shù),卻只能望“數(shù)據(jù)鉆石礦”興嘆。這也就造成了在中國(guó)大數(shù)據(jù)的研究投資高成效小的局面。
當(dāng)然,這里面就包含了第二個(gè)原因——心理障礙。由于政府?dāng)?shù)據(jù)以及與之相關(guān)的諸多應(yīng)用可能會(huì)涉及到公民隱私、國(guó)家安全等重要領(lǐng)域,所以政府為了保證數(shù)據(jù)安全,采取了不公開(kāi)的做法。另外,企業(yè)和個(gè)人為了防止出現(xiàn)侵權(quán)行為的出現(xiàn)對(duì)數(shù)據(jù)公開(kāi)的訴求也不高。這些就形成了心理的屏障,也就阻礙了數(shù)據(jù)的公開(kāi),進(jìn)而使大部分大數(shù)據(jù)的價(jià)值很難發(fā)揮。
雖然近幾年國(guó)家領(lǐng)導(dǎo)人多次強(qiáng)調(diào)要推動(dòng)大數(shù)據(jù)公開(kāi),推進(jìn)實(shí)施大數(shù)據(jù)戰(zhàn)略,但是在真正落實(shí)的時(shí)候仍舊會(huì)受這3方面原因的影響。
總之,大數(shù)據(jù)本身的價(jià)值是值得肯定的,它不僅僅是單純的數(shù)字,而是涵蓋了更多的記錄內(nèi)容,尤其是在互聯(lián)網(wǎng)技術(shù)高速發(fā)展的今天。傳統(tǒng)的數(shù)據(jù)在獲取和處理分析上都需要花費(fèi)大量的人力物力,而且效率不高,所以以技術(shù)為支撐的大數(shù)據(jù)能夠帶來(lái)更多的便利,也讓人們能夠更加關(guān)注數(shù)據(jù)分析和統(tǒng)計(jì)學(xué)。它給我們的生活也帶來(lái)了很多的便利,各行各業(yè)慢慢開(kāi)始使用大數(shù)據(jù)來(lái)為他們服務(wù),所以我們需要重視對(duì)大數(shù)據(jù)的技術(shù)研究和應(yīng)用,讓大數(shù)據(jù)為我們所用,提供更多的服務(wù)和便利,創(chuàng)造更多的財(cái)富。
3 大數(shù)據(jù)處理流程中的短板
對(duì)于大數(shù)據(jù)的處理流程,目前信息領(lǐng)域最權(quán)威的觀點(diǎn)是將其分為4個(gè)步驟,即采集、導(dǎo)入/預(yù)處理、統(tǒng)計(jì)/分析和挖掘。為了便于分析大數(shù)據(jù)處理流程中的短板,筆者又將這4個(gè)步驟概括為兩大環(huán)節(jié):采集端和分析端。
首先是在采集端,大數(shù)據(jù)采集的是人們?cè)诨ヂ?lián)網(wǎng)上留下的痕跡,這些痕跡信息在現(xiàn)代信息技術(shù)支撐下生成,規(guī)模大,又實(shí)時(shí)更新,因此被一些人認(rèn)為比傳統(tǒng)的統(tǒng)計(jì)數(shù)據(jù)更加全面、及時(shí)、透明,所以有學(xué)者將真實(shí)性作為大數(shù)據(jù)的第五個(gè)特點(diǎn)。我對(duì)此持懷疑態(tài)度。當(dāng)下,大數(shù)據(jù)造假的現(xiàn)象由于難于監(jiān)管而廣泛存在,例如刷單、灌水等等,這種人為地在后臺(tái)做手腳,制造虛假數(shù)據(jù)的行為損害了網(wǎng)絡(luò)誠(chéng)信,以此為基礎(chǔ)采集到的數(shù)據(jù)何以保證真實(shí)性,以不盡真實(shí)的數(shù)據(jù)分析得出的結(jié)論又有何說(shuō)服力。此外,某些信息(或行為)在網(wǎng)上留下足夠的痕跡,但在現(xiàn)實(shí)中卻無(wú)跡可尋。比如合肥近來(lái)房?jī)r(jià)高企,開(kāi)發(fā)商為應(yīng)對(duì)限價(jià),明里暗里出售號(hào)頭,即所謂號(hào)頭費(fèi)。網(wǎng)民意見(jiàn)紛紛,但官方一直稱查無(wú)實(shí)據(jù)。
大數(shù)據(jù)為了掌握更多的數(shù)據(jù),放松了容錯(cuò)的標(biāo)準(zhǔn),允許不精確數(shù)據(jù)的存在,這就使得獲取到的大數(shù)據(jù)的錯(cuò)誤率是比較高的,雖然說(shuō)這種不精確性可以讓大數(shù)據(jù)產(chǎn)生大量新型數(shù)據(jù),但它同時(shí)也會(huì)造成數(shù)據(jù)獲取上的不合理。
除了真實(shí)性的問(wèn)題之外,由于目前大數(shù)據(jù)還是有邊界的,它并不覆蓋全體,而仍舊是一個(gè)子集,它到底覆蓋了哪些主體,沒(méi)有對(duì)主體身份的驗(yàn)證例如線下數(shù)據(jù)的校驗(yàn),很有可能會(huì)出現(xiàn)偏差,所以對(duì)于獲取到的大數(shù)據(jù)的代表性和均衡性就難以考證,尤其是針對(duì)某一具體問(wèn)題采集大數(shù)據(jù)的時(shí)候,無(wú)法判斷所采取的數(shù)據(jù)是否有代表性,這一點(diǎn)傳統(tǒng)意義上的數(shù)據(jù)反而優(yōu)于大數(shù)據(jù)。2016年美國(guó)大選期間,網(wǎng)上民調(diào)顯示,希拉里的支持率一直高于特朗普,且基本是大幅領(lǐng)先,但最后的選舉結(jié)果卻讓預(yù)測(cè)希拉里勝出的人瞠目結(jié)舌。退一步說(shuō),即使大數(shù)據(jù)能夠采集到普遍意義上的數(shù)據(jù)信息,那針對(duì)具體問(wèn)題的調(diào)查研究也只能停留在宏觀的層面,而要想深入研究一個(gè)問(wèn)題,還是需要采取傳統(tǒng)的調(diào)查方法,進(jìn)行個(gè)案研究,從微觀層面深入研究,將微觀與宏觀、典型性與普遍性相結(jié)合。
另外,正如上文所說(shuō),我國(guó)目前大量線下數(shù)據(jù)掌握在政府手中,這也就造成了大數(shù)據(jù)在獲取上的不足,所以大數(shù)據(jù)在應(yīng)用時(shí)的價(jià)值和意義并沒(méi)有達(dá)到良好的狀態(tài),不過(guò),在部分大數(shù)據(jù)應(yīng)用的情況下,其也產(chǎn)生了一些不利影響。因?yàn)榇髷?shù)據(jù)被很多人神化,所以他們對(duì)大數(shù)據(jù)抱有敬畏之心,人們?cè)诹私饬舜髷?shù)據(jù)分析的結(jié)果后會(huì)趨向于大數(shù)據(jù)的分析結(jié)果,這就會(huì)造成人們觀點(diǎn)和行為的同質(zhì)化,形成了“沉默的螺旋”。從這個(gè)角度看,數(shù)據(jù)控制著人,左右著人們的思想觀念、生活習(xí)慣和行為等方面,這在無(wú)形中又形成了一種“數(shù)據(jù)綁架”,一定程度上限制了人們的言論自由[5]。更進(jìn)一步說(shuō),在數(shù)據(jù)的不斷獲取中,其準(zhǔn)確性就會(huì)越來(lái)越低。
現(xiàn)在很多學(xué)者批判大數(shù)據(jù)的一點(diǎn)就是大數(shù)據(jù)對(duì)隱私安全的威脅,人們?cè)诰W(wǎng)上留下的痕跡,注冊(cè)的信息等都處于“數(shù)據(jù)監(jiān)控”之中,一旦信息泄露,就會(huì)造成個(gè)人隱私權(quán)的侵犯,更嚴(yán)重的話可能會(huì)危害國(guó)家和社會(huì)。當(dāng)下社會(huì),一些商家利用數(shù)據(jù)信息進(jìn)行營(yíng)銷詐騙的現(xiàn)象常有發(fā)生,所以大數(shù)據(jù)在獲取時(shí)要注重對(duì)數(shù)據(jù)信息的保護(hù)。
然后是在分析端,大數(shù)據(jù)的分析技術(shù)是體現(xiàn)大數(shù)據(jù)價(jià)值的核心部分,從目前的分析技術(shù)來(lái)看,存在的不足主要表現(xiàn)在大數(shù)據(jù)分析的結(jié)果與人的思想和觀點(diǎn)之間的偏差。
筆者以民意為例,大數(shù)據(jù)能否準(zhǔn)確反映民意是一個(gè)值得考證的問(wèn)題。特朗普勝選后,瑞士的德語(yǔ)周刊《雜志》對(duì)其勝選背后的秘密給出的解釋就是“大數(shù)據(jù)”,并指出在特朗普競(jìng)選過(guò)程中扮演關(guān)鍵角色的大數(shù)據(jù)技術(shù)是“心理測(cè)驗(yàn)”,但“心理測(cè)驗(yàn)”法在選民身上實(shí)行起來(lái)有不少障礙。其中的障礙與筆者在上文所談到的數(shù)據(jù)來(lái)源以及可靠性的問(wèn)題有關(guān),除此之外,就是數(shù)據(jù)分析時(shí)的問(wèn)題,特朗普?qǐng)F(tuán)隊(duì)需要完備的選民登記資料,將社交網(wǎng)絡(luò)用戶與具備選民資格的公民身份對(duì)接,資料的不完備和對(duì)接工作的復(fù)雜性都成為了數(shù)據(jù)分析時(shí)的阻礙。而且特朗普勝選的原因其實(shí)很復(fù)雜,不僅僅是大數(shù)據(jù)的原因[6]。
此外,論文查重系統(tǒng)在大數(shù)據(jù)時(shí)代到來(lái)以后,雖然收納了更加海量的論文,但是查重的技術(shù)仍舊還是查詢文字的重合率,這就造成了一個(gè)問(wèn)題,大數(shù)據(jù)的分析技術(shù)能否對(duì)觀點(diǎn)進(jìn)行查重。舉一個(gè)簡(jiǎn)單的例子,假如一篇論文引用了多篇論文的內(nèi)容,但是最后得出了一個(gè)全然不同的觀點(diǎn),這在論文查重系統(tǒng)中會(huì)被定為抄襲。然而在線下生活中,這就類似于在前人已有研究的基礎(chǔ)上繼續(xù)研究,有了新的發(fā)現(xiàn),得出了新的結(jié)論,不應(yīng)該歸為抄襲的隊(duì)列中。大數(shù)據(jù)處理分析技術(shù)的這種局限性就導(dǎo)致了與觀點(diǎn)之間的沖突。
雖然大數(shù)據(jù)是動(dòng)態(tài)可變的,但是其是否是最新的數(shù)據(jù)也是無(wú)法確定的。另外,人的思維隨著時(shí)間的變化也有可能會(huì)發(fā)生變化,而且他們不可能把自己的觀點(diǎn)實(shí)時(shí)反映在互聯(lián)網(wǎng)上,所以大數(shù)據(jù)分析所產(chǎn)生的結(jié)果與實(shí)際生活中人們的思維可能會(huì)出現(xiàn)不一致。
即使大數(shù)據(jù)能夠?qū)崟r(shí)反映人的思維,在分析大數(shù)據(jù)時(shí)仍舊會(huì)暴露出新的問(wèn)題。在社會(huì)科學(xué)領(lǐng)域內(nèi),大數(shù)據(jù)分析的結(jié)果無(wú)法得出一個(gè)統(tǒng)一的結(jié)論。這與自然科學(xué)不同,在自然科學(xué)中,結(jié)論與實(shí)驗(yàn)過(guò)程是一一對(duì)應(yīng)的,不會(huì)出現(xiàn)其他的結(jié)論。社會(huì)科學(xué)雖然也是一門科學(xué),但是對(duì)其的解讀可以有很多種,只要“言之有理即可”,正如《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》中所說(shuō)的那樣,“大數(shù)據(jù)提供的不是最終答案,只是參考
答案?!?/p>
除了大數(shù)據(jù)難以解決數(shù)據(jù)與觀點(diǎn)之間的沖突外,大數(shù)據(jù)在處理海量數(shù)據(jù)時(shí)刪除重復(fù)數(shù)據(jù)的技術(shù)也不完善,目前的方法仍舊停留在把海量數(shù)據(jù)導(dǎo)入到數(shù)據(jù)庫(kù),然后運(yùn)用計(jì)算機(jī)命令進(jìn)行刪除,但是導(dǎo)入海量數(shù)據(jù)耗費(fèi)的時(shí)間成本是巨大的。此外還有海量數(shù)據(jù)的存儲(chǔ)和管理技術(shù)、虛擬化技術(shù)、分布式處理技術(shù)等仍需要進(jìn)一步完善。
4 大數(shù)據(jù)之于新聞傳播的影響
大數(shù)據(jù)時(shí)代下,UGC模式、媒介融合的快速發(fā)展,使得大數(shù)據(jù)對(duì)新聞傳播的影響也是十分深刻的。上文已經(jīng)提到,在大數(shù)據(jù)的技術(shù)背景下,目前各行各業(yè)都在運(yùn)用大數(shù)據(jù)來(lái)為自己服務(wù),新聞行業(yè)也不例外;加之大數(shù)據(jù)的處理環(huán)節(jié)與新聞的制作環(huán)節(jié)是相類似的,它們都需要采集、分析、篩選和整合,所以他們之間的契合度很高。大數(shù)據(jù)形成的數(shù)據(jù)庫(kù)為新聞傳播提供更多的信息,改變了新聞傳播的方式,進(jìn)而促生了一種新型報(bào)道形態(tài)——數(shù)據(jù)新聞。這種新聞?lì)愋鸵怨_(kāi)的數(shù)據(jù)為基礎(chǔ),最大的特點(diǎn)就是可視化以及通過(guò)挖掘大數(shù)據(jù)做出預(yù)測(cè)。目前,由于大數(shù)據(jù)時(shí)代下的數(shù)據(jù)新聞更富有個(gè)性化、趣味性和技術(shù)性,且具有多種形式和多重維度,越來(lái)越多的受眾青睞于這種新興的新聞?lì)愋?。?015年央視播出的“一帶一路特別報(bào)道”《數(shù)說(shuō)命運(yùn)共同體》,就是數(shù)據(jù)新聞的典型案例,其中綜合運(yùn)用了圖表、地圖、動(dòng)畫、真實(shí)紀(jì)錄片等多種形式,展現(xiàn)出詳實(shí)清晰的數(shù)據(jù)信息,讓受眾對(duì)“一帶一路”充滿期待與自信,吸引了更多的人關(guān)注與支持“一帶一路”的發(fā)展。
但數(shù)據(jù)新聞的發(fā)展仍不完善,它同樣存在著上述大數(shù)據(jù)處理流程中的問(wèn)題。首先真實(shí)性是新聞的第一生命,但目前大數(shù)據(jù)采集信息的真實(shí)性仍有待考量。其次就是隱私問(wèn)題,這涉及到了新聞倫理問(wèn)題,大數(shù)據(jù)讓我們每個(gè)人都越來(lái)越透明,加之以新聞媒體的傳播效應(yīng),很容易讓人的權(quán)利受到侵犯。最后是內(nèi)容和形式的辯證關(guān)系問(wèn)題。相比一般的新聞報(bào)道,數(shù)據(jù)新聞具有客觀、可信、深度、廣度、可讀優(yōu)勢(shì),但是其自身有著技術(shù)要求高、成本高、報(bào)道選題受限的弊端,所以其應(yīng)用不可能普遍化。新聞工作者不能讓數(shù)據(jù)或技術(shù)處于新聞傳播的主體地位,這樣會(huì)陷入“技術(shù)中心論”的漩渦,美國(guó)前國(guó)防部部長(zhǎng)麥克納馬拉故事值得我們引以為戒。另外,對(duì)大數(shù)據(jù)的關(guān)注也滲透到了新聞教學(xué)的領(lǐng)域,現(xiàn)在很多高校已開(kāi)設(shè)了“數(shù)據(jù)新聞寫作”的課程。由于沒(méi)有機(jī)會(huì)前往相關(guān)高校調(diào)研課程情況,但筆者認(rèn)為,對(duì)新技術(shù)的學(xué)習(xí)是很有必要的,不過(guò)基礎(chǔ)的新聞寫作仍舊是高校新聞教學(xué)的主體部分,要始終把“內(nèi)容為王”放在第一位,對(duì)數(shù)據(jù)新聞要循序漸進(jìn)地研究和
探索。
5 結(jié)論
大數(shù)據(jù)的發(fā)展是社會(huì)發(fā)展的大趨勢(shì),是一種技術(shù)進(jìn)步,體現(xiàn)了人們互聯(lián)網(wǎng)思維的發(fā)展。目前,大數(shù)據(jù)在信息領(lǐng)域、經(jīng)濟(jì)領(lǐng)域、社會(huì)服務(wù)與管理領(lǐng)域的價(jià)值促進(jìn)了社會(huì)的發(fā)展,創(chuàng)造了很多物質(zhì)和精神上的財(cái)富。而且,它還有很大的發(fā)展空間。但我們不應(yīng)神化大數(shù)據(jù),覺(jué)得技術(shù)能夠統(tǒng)治一切,也不應(yīng)對(duì)數(shù)據(jù)過(guò)分依賴,成為數(shù)據(jù)的奴隸。不管是政府還是個(gè)人,都要理性對(duì)待大數(shù)據(jù),政府要在衡量?jī)r(jià)值后投資大數(shù)據(jù)研究,并要適當(dāng)公開(kāi)數(shù)據(jù);作為個(gè)人,不能盲目追捧和依賴大數(shù)據(jù),要有自己的判斷和認(rèn)識(shí),只有思維和技術(shù)都在發(fā)展的情況下,才能讓大數(shù)據(jù)的漏洞得以修補(bǔ),從而彰顯大數(shù)據(jù)的價(jià)值,讓大數(shù)據(jù)真正地為我們所用。
參考文獻(xiàn)
[1]舍恩伯格,庫(kù)克耶.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013.
[2]王岑嵐,尤建新.大數(shù)據(jù)定義及其產(chǎn)品特征:基于文獻(xiàn)的研究[J].上海管理科學(xué),2016,38(3):25-29.
[3]薛一波.大數(shù)據(jù)的前世、今生與未來(lái)[J].中興通訊技術(shù),2014,20(3):43.
[4]中國(guó)大數(shù)據(jù)產(chǎn)業(yè)生態(tài)地圖,2016:19-21.
[5]曹衛(wèi)東.開(kāi)放社會(huì)及其數(shù)據(jù)敵人[J].讀書,2014(1):
73-80.
[6]夏逸平.大數(shù)據(jù)時(shí)代還需要民意測(cè)驗(yàn)嗎?[N].文匯報(bào),2017-02-24(14).