張 誠,何先剛
(重慶郵電大學(xué) 期刊社,重慶市 400065)
?
“大數(shù)據(jù)”理念與媒體轉(zhuǎn)型發(fā)展*
張誠,何先剛
(重慶郵電大學(xué) 期刊社,重慶市 400065)
摘要:“大數(shù)據(jù)”是時(shí)下的熱門話題。本文概要介紹了“大數(shù)據(jù)”的概念、特性及產(chǎn)生的背景;通過典型案例論述了“大數(shù)據(jù)”的創(chuàng)新理念和帶給傳媒業(yè)的啟示;分析了“大數(shù)據(jù)”發(fā)展態(tài)勢(shì),并提出傳媒轉(zhuǎn)型發(fā)展中應(yīng)注意的問題。
關(guān)鍵詞:大數(shù)據(jù);理念創(chuàng)新;媒體;轉(zhuǎn)型
一、“大數(shù)據(jù)”的定義及作用
我們知道,互聯(lián)網(wǎng)技術(shù)的出現(xiàn)改變了企業(yè)經(jīng)營、政府運(yùn)作以及人們生活的方式?,F(xiàn)在又一種新的、具有同樣巨大變革能力的技術(shù)產(chǎn)生了,那就是“大數(shù)據(jù)”。大數(shù)據(jù)(big data),或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理并整理成為人類所能解讀的數(shù)據(jù)。
“大數(shù)據(jù)”首先是指數(shù)據(jù)體量(volumes)大,其數(shù)據(jù)集一般在10 TB(1 TB=1 024 GB)規(guī)模左右,在實(shí)際應(yīng)用中,許多媒體和企業(yè)的數(shù)據(jù)庫結(jié)合在一起,已可以形成PB(1 PB=1 024 TB)級(jí)的數(shù)據(jù)量;其次是指數(shù)據(jù)類別(variety)多,數(shù)據(jù)來自多種數(shù)據(jù)源,數(shù)據(jù)種類和格式豐富,沖破了以前所限定的結(jié)構(gòu)化數(shù)據(jù)范疇,囊括了半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);第三是數(shù)據(jù)處理速度(Velocity)快,在數(shù)據(jù)量非常龐大的情況下,也能夠做到數(shù)據(jù)的實(shí)時(shí)處理,通常在秒級(jí)時(shí)間范圍內(nèi)給出分析結(jié)果,這個(gè)速度要求是大數(shù)據(jù)處理技術(shù)和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)最大的區(qū)別。最后一個(gè)特點(diǎn)是價(jià)值(Value)大。指大數(shù)據(jù)非凡的洞察力和價(jià)值,能夠?qū)?shù)據(jù)提煉為知識(shí),將知識(shí)轉(zhuǎn)化為決策。
“大數(shù)據(jù)”術(shù)語最早源于apache org的開源項(xiàng)目Nutch,那時(shí)表征的是批量處理或分析所需要的大量數(shù)據(jù)集。谷歌GoogleFile System(GFS)和MapReduce的發(fā)布后,大數(shù)據(jù)不再僅用來描述大量的數(shù)據(jù),還引入了數(shù)據(jù)的獲取、管理和處理技術(shù),形成了今天的被人們廣泛接受的概念。 關(guān)于“大數(shù)據(jù)時(shí)代已經(jīng)到來”的提法是由麥肯錫公司最早提出,他們?cè)谙嚓P(guān)研究報(bào)告中指出:“數(shù)據(jù)已經(jīng)滲透到每一個(gè)行業(yè)和業(yè)務(wù)領(lǐng)域,逐漸成為重要的生產(chǎn)因素,人們對(duì)于海量數(shù)據(jù)的運(yùn)用將預(yù)示著新一波生產(chǎn)率增長和消費(fèi)者盈余浪潮的到來”。該報(bào)告發(fā)布后,大數(shù)據(jù)成為了傳媒業(yè)的熱門話題,世界各國政府給予了極大關(guān)注。[1]
大數(shù)據(jù)具有非凡的意義和價(jià)值。(1)它的意義不僅僅是人與人、人與物之間的通信聯(lián)絡(luò)和數(shù)據(jù)交換的信息載體,還可以通過計(jì)算機(jī)處理和分析,獲得從少量數(shù)據(jù)中無法獲取的東西,得出客觀準(zhǔn)確的結(jié)論,幫助政府、企業(yè)和個(gè)人做出正確決策。(2)大數(shù)據(jù)的作用不光是指通過算法對(duì)數(shù)據(jù)進(jìn)行分析,揭示歷史規(guī)律和未來發(fā)展趨勢(shì),通過它,人們能更方便地讓機(jī)器像人一樣通過自我學(xué)習(xí),不斷提高發(fā)現(xiàn)問題和解決問題的能力,這也標(biāo)志著人類社會(huì)智能時(shí)代到來。(3)大數(shù)據(jù)的價(jià)值除了指“淘寶網(wǎng)”通過對(duì)用戶上網(wǎng)行為軌跡的跟蹤,獲取用戶的興趣愛好而展開精準(zhǔn)商品推薦,它更多的是向人們提供各種各樣的優(yōu)質(zhì)服務(wù),使人們的生活質(zhì)量得到極大的提高。這些服務(wù)大到谷歌利用搜索數(shù)據(jù)預(yù)測(cè)禽流感的發(fā)展趨勢(shì),配合醫(yī)療部門取得了一場流行病阻擊戰(zhàn)的勝利;小到城市規(guī)劃局利用百年來積累的城市下水系統(tǒng)資料預(yù)測(cè)問題井蓋,替納稅人省下了一大筆支出。(4)大數(shù)據(jù)的戰(zhàn)略意義還可以從奧巴馬政府對(duì)大數(shù)據(jù)的作為和認(rèn)識(shí)中凸顯。2012年3月22日,奧巴馬決定向“大數(shù)據(jù)”行業(yè)注資2億美元促進(jìn)其發(fā)展,在隨后的會(huì)議上,將“大數(shù)據(jù)”定義為“未來的新石油”,認(rèn)為:“一個(gè)國家擁有數(shù)據(jù)的規(guī)模、活性及解釋運(yùn)用的能力將成為綜合國力的重要組成部分,未來對(duì)數(shù)據(jù)的占有和控制甚至將成為繼陸權(quán)、海權(quán)、空權(quán)之外另一個(gè)國家核心資產(chǎn)”。[2]
二、“大數(shù)據(jù)”理念創(chuàng)新
利用大數(shù)據(jù)實(shí)現(xiàn)人們所需的價(jià)值,要求人們改變對(duì)數(shù)據(jù)的傳統(tǒng)思維習(xí)慣。首先,要淡化對(duì)因果關(guān)系的熱衷,轉(zhuǎn)向?qū)ο嚓P(guān)關(guān)系的關(guān)注;其次,減少對(duì)樣本數(shù)據(jù)的應(yīng)用,盡量采用海量或全部數(shù)據(jù);第三,接受數(shù)據(jù)的混雜性,放棄追求數(shù)據(jù)的精確性。
(一)更好——不是因果關(guān)系,而是相關(guān)關(guān)系
因果關(guān)系是人們認(rèn)識(shí)世界與解釋事物發(fā)展變化的一種方式,它告訴我們:只有找出某一事物或現(xiàn)象的原因,才能認(rèn)識(shí)其本質(zhì)規(guī)律并提出解決問題的方法。許多仁人志士習(xí)慣于跋涉在這條擁擠的“因果”路上,然而抵達(dá)目的并非只此獨(dú)路一條,通過事物間存在的相關(guān)性,人們踏進(jìn)真理殿堂的路甚至更為便捷、寬廣。
一個(gè)事物總存在一個(gè)(多個(gè))與自己有關(guān)聯(lián)的事物,當(dāng)關(guān)聯(lián)事物發(fā)生變化時(shí),自己也會(huì)發(fā)生變化,這種事物間的關(guān)聯(lián)稱為相關(guān)關(guān)系。人與人之間有同事關(guān)系、朋友關(guān)系;單位之間有上下級(jí)關(guān)系,合作關(guān)系等。如果您想會(huì)見不認(rèn)識(shí)的張三,找到您相識(shí)的李四(張三的同事)便可達(dá)其目的,這便借助了同事關(guān)系。這種相關(guān)有正相關(guān)、負(fù)相關(guān)和奇異相關(guān),在數(shù)學(xué)上以函數(shù)y=f(x)(或y=f(x,y,z))表示,當(dāng)自變量x變化時(shí),因變量也會(huì)發(fā)生變化。大數(shù)據(jù)思維提倡者認(rèn)為, 應(yīng)對(duì)大數(shù)據(jù), 沒必要運(yùn)用因果律, 只要從雜亂無章的數(shù)據(jù)叢林中尋找出數(shù)據(jù)的相關(guān)性即可。
一個(gè)典型的例子是亞馬遜網(wǎng)絡(luò)書店。亞馬遜為了擴(kuò)大書籍銷量,根據(jù) “宣傳做得好,書就賣得好”的因果律,聘請(qǐng)了20多名書評(píng)家組成一個(gè)團(tuán)隊(duì),他們寫書評(píng)、介紹新書、挑選特色書在網(wǎng)站主頁宣傳。他們的宣傳、推廣使得書籍銷量大幅提升,成為亞馬遜銷售的一大亮點(diǎn)和核心競爭力。不久,亞馬遜進(jìn)行了另一個(gè)實(shí)驗(yàn),使用大數(shù)據(jù)分析法,從網(wǎng)站多年收集的海量用戶數(shù)據(jù)中發(fā)現(xiàn)了諸如某個(gè)客戶購買了什么書籍,關(guān)注了什么書,哪些是關(guān)注而又沒購買的書等數(shù)據(jù),然后讓計(jì)算機(jī)提出個(gè)性化的新書推薦方案。結(jié)果發(fā)現(xiàn),通過計(jì)算機(jī)系統(tǒng)推薦的書的銷量,比起專家團(tuán)隊(duì)推薦的要高出100倍,于是,他們解散了專家團(tuán)隊(duì)。亞馬遜的這套計(jì)算機(jī)推薦系統(tǒng)只是梳理出了一些有趣的相關(guān)關(guān)系,也即“是什么”(客戶購買了什么書,關(guān)注了什么書),而不是去追求“為什么”(為何購買,為何關(guān)注)。正是“關(guān)注”與“購買”間的相關(guān)關(guān)系幫助亞馬遜獲得了成功。
現(xiàn)實(shí)生活中,人們常常熱衷于用因果律思考問題,認(rèn)為因果聯(lián)系淺顯明了、容易尋找。其實(shí)不然,即使用數(shù)學(xué)這種直接的方法,也很難輕易證明“因”與“果”之間的必然聯(lián)系,而相關(guān)關(guān)系的實(shí)驗(yàn)證明不僅耗資少,費(fèi)時(shí)也少。借助相關(guān)關(guān)系,我們不僅可獲得分析問題和解決問題的新視角,而且這些視角都很清晰明了,更容易尋找到問題的解決方法。在大數(shù)據(jù)環(huán)境下,知道“是什么”就足夠了,沒有必要知道“為什么”。
(二)更佳——不是隨機(jī)樣本,而是全體數(shù)據(jù)
抽樣分析在數(shù)據(jù)分析的歷史長河中已統(tǒng)治了許多朝代,這是因?yàn)槭占?、?chǔ)存和分析數(shù)據(jù)的技術(shù)不夠好,無法對(duì)大量數(shù)據(jù)進(jìn)行整體分析處理,只能從大量數(shù)據(jù)中隨機(jī)采樣,進(jìn)行樣本分析。為了讓分析變得簡單,并適應(yīng)已有工具的能力,人們常常會(huì)把數(shù)據(jù)量縮減到最少。事實(shí)上,在許多情況下,這種以部分代表整體的做法并不科學(xué)。
一名期刊研究人員,在全國近萬家期刊社中,通過電話采訪了三十多家刊社,得到樣本期刊已簽署版權(quán)協(xié)議的百分率,據(jù)此說明全國期刊簽署協(xié)議的狀況。這種數(shù)據(jù)抽樣分析方式生成的結(jié)果,給人的感覺就像把一張數(shù)碼照片或者一首數(shù)碼歌曲抽取一些點(diǎn)或片段構(gòu)成一個(gè)小的部分來展現(xiàn)播放——你能欣賞這樣一首抽樣的歌嗎?弱水三千, 若只研究一瓢水的內(nèi)容, 顯然不能把握全部。
大數(shù)據(jù)時(shí)代是摒棄隨機(jī)抽樣,而采用海量或全部數(shù)據(jù)做分析的時(shí)代。在這個(gè)時(shí)代,高性能數(shù)據(jù)技術(shù)的發(fā)展和普及,使我們能夠?qū)φw數(shù)據(jù)進(jìn)行分析處理,所得到的結(jié)果更精確,更符合客觀現(xiàn)實(shí)。
華爾街“德溫特資本市場”公司首席執(zhí)行官保羅·霍廷每天的工作之一,就是利用電腦程序收集和分析全球3.4億個(gè)微博賬戶的留言,實(shí)時(shí)判斷民眾對(duì)股市的情感傾向。方法是將留言表現(xiàn)出的看漲(跌)的情感程度劃分成幾級(jí):如自信、期待、焦慮和絕望等,并賦予相應(yīng)的分?jǐn)?shù)。根據(jù)計(jì)算機(jī)打分結(jié)果,霍廷再?zèng)Q定如何處理手中的股票?;敉⒌呐袛喾ê芎唵危寒?dāng)打分結(jié)果高時(shí),即絕大多數(shù)人看漲,那就買入;當(dāng)分?jǐn)?shù)低時(shí),即大家的焦慮情緒上升,普遍看跌時(shí),那就拋售。這一招收效顯著——當(dāng)年第一季度,霍廷的公司獲得了可觀的收益率。[3]保羅·霍廷之所以成功,最為核心的因素,不是因?yàn)樗臄?shù)學(xué)建模合理,也不是因?yàn)樗臄?shù)據(jù)處理技術(shù)先進(jìn),而是因?yàn)樗治龅臄?shù)據(jù)特別大——全球3.4億個(gè)微博賬戶的留言。沒有這個(gè)大數(shù)據(jù),保羅·霍廷即使有更好的數(shù)學(xué)模型,更先進(jìn)的計(jì)算技術(shù),仍擺脫不了和其他散民一樣,靠運(yùn)氣吃飯。這個(gè)例子告訴我們:隨著“大數(shù)據(jù)”的進(jìn)一步發(fā)展,在不久的將來,那種“只賺不賠”的股市神話將演繹為真實(shí)的商業(yè)故事。
面對(duì)大數(shù)據(jù),人類社會(huì)曾沿襲多年的數(shù)據(jù)理念和行為方式將遭受巨大的沖擊,人們推崇的抽樣分析或?qū)⒏鎰e喧囂的昨天,步入孤獨(dú)冷落的明天。而未來,“大數(shù)據(jù)”將以氣勢(shì)恢宏的能量扮演著摧古拉朽、推進(jìn)發(fā)展的重要角色。
(三)更優(yōu)——不是精確性,而是混雜性
模擬時(shí)代及其以前,一方面,由于數(shù)據(jù)收集的有限性,細(xì)微的數(shù)據(jù)錯(cuò)誤會(huì)被放大,進(jìn)而影響全局;另一方面,由于計(jì)算技術(shù)的時(shí)代性,在數(shù)據(jù)分析之前,通常需要先將數(shù)據(jù)進(jìn)行清洗和標(biāo)準(zhǔn)化,做成有結(jié)構(gòu)的數(shù)據(jù),以適應(yīng)機(jī)器的處理需要。所以在數(shù)據(jù)統(tǒng)計(jì)分析中,數(shù)據(jù)必須精確。但是,只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫的,如果人們的觀念和習(xí)慣不轉(zhuǎn)變,那么95%的非結(jié)構(gòu)和半結(jié)構(gòu)化的數(shù)據(jù),包括辦公文檔、文本、圖片、XML、HTML、各類報(bào)表、圖像和音頻/視頻信息等都不能被利用。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,在不斷涌現(xiàn)的新情況里,人們逐漸發(fā)現(xiàn)允許不精確的出現(xiàn)已經(jīng)不是一個(gè)缺點(diǎn)而是一個(gè)新的優(yōu)點(diǎn),甚至是一個(gè)價(jià)值亮點(diǎn)。少許的混亂或錯(cuò)誤不會(huì)沖淡主題,就像一本小說,出現(xiàn)少量的錯(cuò)漏并不影響人們的閱讀和理解一樣,體量龐大的數(shù)據(jù)也不會(huì)因少量的混亂而失去價(jià)值。反而,因放松了容錯(cuò)的標(biāo)準(zhǔn),人們掌握的數(shù)據(jù)也就更龐大。如此一來,就不是大量數(shù)據(jù)優(yōu)于少量數(shù)據(jù)那么簡單了,而是大量數(shù)據(jù)創(chuàng)造了更多更好的結(jié)果。
美國勞工統(tǒng)計(jì)局每月都要公布消費(fèi)物價(jià)指數(shù)(CPI),這是用來測(cè)試通貨膨脹率的。要獲得CPI指數(shù),政府每年要花費(fèi)兩億五千萬美元去雇用很多人向全美90個(gè)城市的商店、辦公室打電話,發(fā)傳真甚至登門拜訪。反饋回來的各類商品價(jià)格數(shù)據(jù)達(dá)80 000種,包括瓜果的價(jià)格、行車的票價(jià)等。這些人工收集的數(shù)據(jù)是精確的也是有序的,但是整理、計(jì)算出CPI并公布會(huì)有幾周的滯后。2008年的金融危機(jī)表明,這個(gè)滯后是致命的。麻省理工學(xué)院的兩位經(jīng)濟(jì)學(xué)家對(duì)此提出了一個(gè)大數(shù)據(jù)方案,即接受更混亂的數(shù)據(jù)。他們通過一個(gè)軟件在互聯(lián)網(wǎng)上收集數(shù)據(jù),每天可以收集到50萬種商品的價(jià)格。這些數(shù)據(jù)很混亂,也有不少的數(shù)據(jù)是錯(cuò)誤的,但是把大數(shù)據(jù)和好的分析法相結(jié)合,這個(gè)項(xiàng)目在2008年9月雷曼兄弟破產(chǎn)之后馬上就發(fā)現(xiàn)了通貨緊縮趨勢(shì),然而那些依賴官方數(shù)據(jù)的人直到11月份才知道這個(gè)情況。
執(zhí)迷于精確性是數(shù)據(jù)缺乏時(shí)代和模擬時(shí)代的產(chǎn)物。大數(shù)據(jù)時(shí)代,需要我們拋棄對(duì)有條理和純凈數(shù)據(jù)的偏愛,轉(zhuǎn)而接受雜亂無章。只有接受不精確性,您才能跨進(jìn)一個(gè)從未涉足的更大更精彩的世界,否則您將永遠(yuǎn)被拒之門外。
三、“大數(shù)據(jù)”帶給傳媒的啟示
目前,傳統(tǒng)媒體正處于重要的數(shù)字化轉(zhuǎn)型期,如何轉(zhuǎn),大家都還處于迷茫之中。大數(shù)據(jù)是傳媒業(yè)數(shù)字化轉(zhuǎn)型的一個(gè)加強(qiáng)版,它作為一種世界觀和一種戰(zhàn)略理念,為躊躇中的傳媒帶來啟迪并指明方向,實(shí)現(xiàn)媒體從傳統(tǒng)的運(yùn)營方式轉(zhuǎn)型為高效的數(shù)字化出版。
(一)轉(zhuǎn)變思維,確立數(shù)據(jù)為“王”
傳媒轉(zhuǎn)型發(fā)展中,有過技術(shù)為王、渠道為王、內(nèi)容為王之爭。“大數(shù)據(jù)”時(shí)代,由于數(shù)據(jù)在價(jià)值屬性上有了根本性改變,數(shù)據(jù)已成為政治、經(jīng)濟(jì)及個(gè)人生活中的關(guān)鍵資源和重要資本。在中國,傳媒正處于轉(zhuǎn)型時(shí)期,數(shù)據(jù)的收集分析對(duì)于媒體的發(fā)展極為重要,不但可以幫助媒體了解自己的經(jīng)營狀況、又可以掌握市場發(fā)展趨勢(shì),更能幫助媒體制定轉(zhuǎn)型策略。因此,在大數(shù)據(jù)時(shí)代,媒體要有強(qiáng)烈的數(shù)據(jù)意識(shí),要善于挖掘數(shù)據(jù)、分析數(shù)據(jù)和使用數(shù)據(jù),養(yǎng)成數(shù)據(jù)為王的觀念。只有抓住了數(shù)據(jù),才能在下一波的社會(huì)競爭中脫穎而出。
(二)拓展視野,做類型豐富的大媒體
數(shù)據(jù)的規(guī)模和類型決定著數(shù)據(jù)價(jià)值的大小。數(shù)據(jù)規(guī)模越大,事物的整體特征越明確,產(chǎn)生的價(jià)值也就越大;數(shù)據(jù)類型越豐富,相關(guān)關(guān)系就越清晰,事物的本質(zhì)就更容易揭示?!按髷?shù)據(jù)”時(shí)代特別要求數(shù)據(jù)的全面和類型盡可能豐富。數(shù)據(jù)的豐富既要在廣度又要在深度上體現(xiàn),媒體要有自己的采編隊(duì)伍、原創(chuàng)新聞和原創(chuàng)評(píng)論;還要建立一個(gè)自己的網(wǎng)站——一個(gè)互動(dòng)的、社交化的、擁有廣泛人氣,能夠收集、整理和處理用戶數(shù)據(jù)的數(shù)字化平臺(tái);而且要依靠訓(xùn)練有素的編輯記者寫出廓清謠言、求真求證的深度文章。媒體要杜絕“小農(nóng)意識(shí)”,不能養(yǎng)成在一小塊地上自耕自作,無協(xié)作、無交換、無發(fā)展的思維習(xí)慣,而要站在數(shù)據(jù)產(chǎn)業(yè)的高度分析現(xiàn)狀,思考未來,使自身成長為數(shù)據(jù)規(guī)模龐大、類型豐富的“大媒體”。[4]
(三)建設(shè)數(shù)據(jù)庫,實(shí)施平臺(tái)化戰(zhàn)略
當(dāng)今是一個(gè)媒介融合的大時(shí)代,在數(shù)字化技術(shù)的推波助瀾下,媒介的融合不斷深化拓展,呈現(xiàn)出數(shù)據(jù)生產(chǎn)、數(shù)據(jù)傳播、數(shù)據(jù)應(yīng)用等相關(guān)產(chǎn)業(yè)“你中有我,我中有你”的大融合格局。在此格局下,一種更具包容性,能提供多種數(shù)據(jù)類型的“平臺(tái)模式”已成為最具競爭力的發(fā)展模式。因此,在“大數(shù)據(jù)”趨勢(shì)下,轉(zhuǎn)型中的傳媒企業(yè)要加快數(shù)據(jù)庫建設(shè),在平臺(tái)化戰(zhàn)略中搶占高地,促進(jìn)生產(chǎn)方式、產(chǎn)品屬性的華麗轉(zhuǎn)身。書報(bào)刊媒體作為信息業(yè)的前沿,擁有先天數(shù)據(jù)優(yōu)勢(shì),通過數(shù)字化和平臺(tái)化戰(zhàn)略,紙媒的劣勢(shì)可轉(zhuǎn)化為優(yōu)勢(shì),優(yōu)勢(shì)又會(huì)帶來大價(jià)值。除了利用已有的歷史數(shù)據(jù)外,更要建立自己的數(shù)據(jù)收集、挖掘、處理、展示和應(yīng)用平臺(tái),只有這樣,傳統(tǒng)媒體才能在“大數(shù)據(jù)時(shí)代”煥發(fā)新生,獲得大發(fā)展。
(四)用好數(shù)據(jù),提升媒體影響力
大數(shù)據(jù)時(shí)代,既要用事實(shí)說話,也要用數(shù)據(jù)說話。 數(shù)據(jù)爆炸時(shí)代,用戶需要更準(zhǔn)確分析、更深層解讀和更明晰呈現(xiàn)的數(shù)據(jù)新聞。媒體可以通過自己的數(shù)據(jù)挖掘平臺(tái),從海量數(shù)據(jù)中發(fā)現(xiàn)新聞線索,以直觀和可視化的數(shù)據(jù)圖表方式呈現(xiàn)給廣大用戶,滿足他們對(duì)知識(shí)的渴求,進(jìn)而提升媒體影響力。例如,英國《衛(wèi)報(bào)》對(duì)于2011年8月倫敦騷亂所策劃制作的“解讀騷亂”專題,收集了Twitter上發(fā)布的250多萬條與騷亂有關(guān)的數(shù)據(jù),從中分析和挖掘出騷亂真相。他們的做法是:把七個(gè)廣為傳播的謠言用七張照片排放在一張表上,點(diǎn)擊一張照片即可進(jìn)入該謠言的動(dòng)態(tài)傳播過程圖?!缎l(wèi)報(bào)》網(wǎng)站正是以大規(guī)模的數(shù)據(jù)分析,加上簡潔、直觀和明了的圖表及視屏,跳出人云亦云的困境,提供了更深度、更專業(yè)的新聞報(bào)道,也使自己獲得了極大的社會(huì)影響力。
(五)服務(wù)用戶,開展精準(zhǔn)傳播
大數(shù)據(jù)時(shí)代,新聞傳播將更有針對(duì)性、更精準(zhǔn),傳播將更有效果。傳統(tǒng)媒體上網(wǎng)之后,積累了大量的用戶數(shù)據(jù),可通過網(wǎng)民點(diǎn)擊、搜索、查閱的行為軌跡掌握網(wǎng)民興趣偏好,實(shí)施精準(zhǔn)傳播。這種受眾數(shù)據(jù)化,已經(jīng)廣泛應(yīng)用于個(gè)性化新聞?dòng)喼坪鸵粚?duì)一的廣告投放。 例如,F(xiàn)acebook 的大數(shù)據(jù)產(chǎn)品——“時(shí)間線”(Timeline), 它是供用戶自我記錄生活故事的應(yīng)用。Facebook 通過這些歷史數(shù)據(jù),能夠掌握用戶的喜好,進(jìn)而有針對(duì)性地投放廣告,獲得了豐厚的收益。
(六)培養(yǎng)人才,掌握大數(shù)據(jù)技術(shù)
大數(shù)據(jù)時(shí)代需要傳媒人具備發(fā)現(xiàn)規(guī)律、洞察本質(zhì)、數(shù)學(xué)建模和數(shù)據(jù)分析的能力,但是,傳媒業(yè)的專業(yè)工程師雖然擅長數(shù)據(jù)處理分析技術(shù),對(duì)國情、社會(huì)、政治、經(jīng)濟(jì)的了解卻并非強(qiáng)項(xiàng);而編輯記者同人與社會(huì)打交道,對(duì)事物有獨(dú)特的觀察力,卻對(duì)大數(shù)據(jù)技術(shù)了解不多,基本的算法及數(shù)據(jù)分析方法更是知之甚少。因此,傳媒業(yè)要發(fā)展,需要避己之弱,補(bǔ)足自身發(fā)展的短板。媒體需著力培養(yǎng)大數(shù)據(jù)時(shí)代的媒體專家,讓編輯記者了解大數(shù)據(jù),懂得用大數(shù)據(jù)技術(shù)分析解剖社會(huì)問題,同時(shí)也要讓專業(yè)工程師熟悉社會(huì)、了解社會(huì),增強(qiáng)政治辨識(shí)能力。擁有這樣一批“全才”,傳媒業(yè)才有更大的發(fā)展?jié)摿?。[5]
四、幾點(diǎn)思考
(一)大數(shù)據(jù)是一個(gè)過程
在初級(jí)階段,大數(shù)據(jù)應(yīng)用與傳統(tǒng)數(shù)據(jù)應(yīng)用并存,不存在誰取代誰 ,而且,作為一個(gè)新生事物,大數(shù)據(jù)還需要經(jīng)過一段較長的時(shí)間才能壯大起來,在目前情況下不宜盲目地、一窩蜂地上大數(shù)據(jù)項(xiàng)目。
(二)大數(shù)據(jù)是一種思維方式
即使今天沒有大數(shù)據(jù),人們還是可以比較客觀、全面地測(cè)量世界。對(duì)于轉(zhuǎn)型的媒體而言,要有“從現(xiàn)在做起”的世界觀和未雨綢繆、決戰(zhàn)未來的戰(zhàn)略。微信在設(shè)計(jì)之初就著力數(shù)據(jù)收集,并納入基礎(chǔ)框架,這是意識(shí)和實(shí)力的體現(xiàn),也是成功的必然。
(三)價(jià)值不是大數(shù)據(jù)專享的屬性,小數(shù)據(jù)照樣有價(jià)值
從數(shù)據(jù)中發(fā)現(xiàn)價(jià)值由來已久,但有一點(diǎn)毋庸置疑,那就是傳統(tǒng)的數(shù)據(jù)分析法適應(yīng)不了大數(shù)據(jù)的發(fā)展。大數(shù)據(jù)的功勞在于喚醒大家的意識(shí)和覺悟,使之融入新時(shí)代,迎接“大數(shù)據(jù)”。
(四)數(shù)據(jù)安全是一個(gè)挑戰(zhàn)
網(wǎng)絡(luò)高科技公司通過分析用戶行為數(shù)據(jù),可以精準(zhǔn)判斷用戶的喜好乃至性格,不知不覺間我們也暴露了大量個(gè)人隱私。大數(shù)據(jù)時(shí)代“既令人激動(dòng)又讓人恐懼。擁有海量數(shù)據(jù)的公司們甚至要比你還要了解你自己,它們能預(yù)測(cè)你接下來可能做什么”,曾經(jīng)的谷歌全球副總裁、大中華區(qū)總裁李開復(fù)如是說?!皼]人在竊聽你的電話”這是總統(tǒng)奧巴馬向美國公民的保證,但是只要有撥打電話的記錄,什么私密對(duì)話都有了。要便利還是要隱私?這真的是一個(gè)問題。
總之,對(duì)于轉(zhuǎn)型的媒體企業(yè)而言,既不能夸大,也不能縮小大數(shù)據(jù)的作用,要理性地分析自己,規(guī)劃自己,決策自己,才能在未來的大數(shù)據(jù)浪潮中立于不敗之地。
[參考文獻(xiàn)]
[1] 鐘瑛,張恒山.大數(shù)據(jù)的緣起、沖擊及其應(yīng)對(duì)[J].現(xiàn)代傳播,2013(7):104-109.
[2] 湯景泰.大數(shù)據(jù)時(shí)代的傳媒轉(zhuǎn)型:觀念與策略[J].新聞與寫作,2013,9(5).
[3] 余建斌.侃大數(shù)據(jù):人人都有洞察力[N].人民日?qǐng)?bào),2013-07-05.
[4] 甘沙.大數(shù)據(jù)不是“靈丹妙藥”[N].科技日?qǐng)?bào),2013-11-13.
[5] 官建文,劉揚(yáng),劉振興.大數(shù)據(jù)時(shí)代對(duì)于傳媒業(yè)意味著什么[J].新聞戰(zhàn)線,2013(2) :18-22.
(責(zé)任編校:朱德東)
Big Data Idea and Media Transition Development
ZHANG Cheng, HE Xian-gang
(EditorialOffice,ChongqingUniversityofPostsandTelecommunications,Chongqing400065,China)
Abstract:Big Data is a hot topic at present. This paper introduces the concept, character and producing background of Big Data, discusses the innovative idea of Big Data and its enlightenment on media, analyzes its development tendency and proposes the issues in media transition development.
Key words:Big Data; idea innovation; media; transition
中圖分類號(hào):G21
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1672- 0598(2016)01- 0104- 05
[作者簡介]張誠(1958—),男,重慶人;重慶郵電大學(xué)期刊社編審,主要從事數(shù)字出版、新媒體研究。何先剛(1969—),男,四川大竹人;重慶郵電大學(xué)期刊社編審,主要從事系統(tǒng)評(píng)價(jià)、新媒體、信息管理、數(shù)學(xué)等研究。
[基金項(xiàng)目]教育部科技發(fā)展中心(2013120)“基于網(wǎng)絡(luò)出版的電子期刊評(píng)價(jià)指標(biāo)體系及評(píng)價(jià)機(jī)制研究”
[收稿日期]*2015-10-21
doi:12.3969/j.issn.1672- 0598.2016.01.017
重慶工商大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2016年1期