沈浩 中國傳媒大學(xué)/調(diào)查統(tǒng)計(jì)研究所
大數(shù)據(jù)時(shí)代的數(shù)據(jù)新聞和可視化傳播
沈浩 中國傳媒大學(xué)/調(diào)查統(tǒng)計(jì)研究所
本文對(duì)大數(shù)據(jù)時(shí)代的數(shù)據(jù)新聞和可視化傳播進(jìn)行了闡述,對(duì)數(shù)據(jù)新聞的層次進(jìn)行了分析。結(jié)合實(shí)際介紹了數(shù)據(jù)可視化技術(shù)在電視新聞的應(yīng)用。
大數(shù)據(jù)時(shí)代 數(shù)據(jù)新聞 可視化傳播
今天看到很多演講嘉賓在談到當(dāng)今廣電的時(shí)候,其實(shí)都離不開和互聯(lián)網(wǎng)的關(guān)系。我們看到現(xiàn)在的電視,已經(jīng)有了操作性,可以選擇我們是要看電視,還是要上網(wǎng)。這樣的互動(dòng)過程,今天人們把他稱作移動(dòng)化時(shí)代,今天也是一個(gè)大數(shù)據(jù)時(shí)代。我今天的主題就基于大數(shù)據(jù)。
大數(shù)據(jù)實(shí)際上來自于我們更關(guān)注的消費(fèi)者,或者我們的受眾,他們每天的足跡,每天的支付行為,每天的觀影行為,當(dāng)然也包括他們的社交行為。前一段時(shí)間有一本很重要的書叫《大數(shù)據(jù)實(shí)戰(zhàn)》,也有一本書叫《爆發(fā):大數(shù)據(jù)時(shí)代預(yù)見未來的新思維》。這本書在出版的時(shí)候請(qǐng)我寫一個(gè)推薦語,我是這么說的:這是一個(gè)令人興奮的時(shí)代,也是一個(gè)大數(shù)據(jù)的時(shí)代,數(shù)據(jù)科學(xué)讓我們?cè)絹碓蕉嗟貜臄?shù)據(jù)中觀察到人類社會(huì)的復(fù)雜行為模式,以數(shù)據(jù)為基礎(chǔ)的技術(shù)決定著人類的未來。《爆發(fā)》這本書的核心觀點(diǎn)是什么呢?核心觀點(diǎn)是說人類行為的93%是可預(yù)知的。
您相信這一點(diǎn)嗎?您是關(guān)心93%太大了還是什么呢?其實(shí)我更關(guān)心的是什么叫人類。人類說的是你還是我?說的是男人還是女人?說的北京人,還是說的江蘇人?其實(shí)當(dāng)今天大數(shù)據(jù)來的時(shí)候,我們實(shí)際上已經(jīng)指名道姓地分析一個(gè)人的行為。不過有人說我不用微博,沒有問題,盡管你不用微博,但是我們已經(jīng)有足夠大量的數(shù)據(jù),在擁有一個(gè)群體,就像中國移動(dòng)也沒有所有的手機(jī)用戶一樣。當(dāng)然也有人說我在微博上說的都是假的。假的也沒有問題,為什么呢?你是誰?其實(shí)跟你沒有關(guān)系,而是我看你,你是誰。
過去我們研究我們的消費(fèi)者,研究我們的受眾,我們研究來研究去,得出一個(gè)結(jié)論,一方水土養(yǎng)活一方人。就像我們見面了,他會(huì)問沈老師你是哪兒的人呢?我說我是上海人。他說上海人怎么那么愛吃辣的呢?我就是愛吃辣的,因?yàn)槟闶巧虾H司蛯?duì)你打了標(biāo)簽,但隨著我們對(duì)受眾和消費(fèi)者的深入了解,我們希望更深入地研究哪些是我的VIP。但是今天在大數(shù)據(jù)時(shí)代,在移動(dòng)互聯(lián)網(wǎng)時(shí)代,其實(shí)我們更關(guān)注的是社會(huì)。什么是社會(huì)?一個(gè)人不是社會(huì),兩個(gè)人也不是社會(huì),只有三個(gè)人我們才進(jìn)入社會(huì)。正如中國那句老話:道生一,一生二,二生三,三生萬物。那么如何研究這個(gè)關(guān)系呢?其實(shí)今天人和人之間的關(guān)系也是大數(shù)據(jù),因?yàn)槲覀兺ㄟ^關(guān)系就可以捕捉個(gè)人的價(jià)值。所以從這里面來講什么是人類?當(dāng)然我們真的有時(shí)候看到人類是什么樣呢?
上面這張圖的背景實(shí)時(shí)的顯示了當(dāng)前在地球上誰在使用推特,用了推特就會(huì)有亮點(diǎn)顯示,慢慢地這個(gè)亮點(diǎn)就會(huì)有這樣的呈現(xiàn)。當(dāng)然我們立刻看到原來中國的推特一片黑,說明中國人不愛用推特,當(dāng)然我說的婉轉(zhuǎn)一點(diǎn)。其實(shí)我們立刻就可以從數(shù)據(jù)可視化中感受到社會(huì),所以大數(shù)據(jù)它一個(gè)很重要的特點(diǎn),它可以分析一個(gè)人。就像有人問什么是大數(shù)據(jù)?我說大數(shù)據(jù)其實(shí)就是挖拉登,只要拉登敢打電話,美國就可以在大量的數(shù)據(jù)中尋找這些信息,衛(wèi)星、導(dǎo)彈就下來了,它可能就是精確打擊一個(gè)人。當(dāng)然了,大數(shù)據(jù)也可以分析全體,去感知這個(gè)社會(huì)的輿情,網(wǎng)民、受眾對(duì)某個(gè)節(jié)目的感知,當(dāng)我們看到這些的時(shí)候,大數(shù)據(jù)不太愛分析的是什么呢?是我們的平均人。
讓我們來看大數(shù)據(jù)跟傳媒跟廣電有什么樣的關(guān)系。十年前我在我們學(xué)校的新聞學(xué)院創(chuàng)建了一個(gè)專業(yè)叫媒體市場調(diào)查與分析,當(dāng)時(shí)指的是跟小數(shù)據(jù)的融合,我們希望我們的廣電擁有具有國際視野,掌握計(jì)算機(jī)的人才。十年之后,我們又創(chuàng)建了一個(gè)新的專業(yè)方向,是大數(shù)據(jù)跟新聞學(xué)的融合,我們誕生了一個(gè)數(shù)據(jù)新聞專業(yè),我們也是全國第一個(gè)創(chuàng)建這一專業(yè)。我們的傳統(tǒng)新聞要不要這些記者去做CT,要不要學(xué)會(huì)編程呢?這是一個(gè)問題。今年我們開始實(shí)現(xiàn)自主招生,學(xué)校批準(zhǔn)了自主招生,競爭非常激烈,同時(shí)也看到了很多人對(duì)數(shù)據(jù)新聞產(chǎn)生了興趣,我們還關(guān)注當(dāng)前比較熱的像對(duì)無人機(jī)的新聞報(bào)道,比方說機(jī)器人新聞寫作,以及可能的VR、AR在新聞?lì)I(lǐng)域的應(yīng)用,我們?cè)诓粩嗵剿鳌?/p>
其實(shí)在很早的時(shí)候,臉譜的一個(gè)實(shí)習(xí)生,曾經(jīng)把臉譜全球社交網(wǎng)絡(luò)以非常好的方式呈現(xiàn)在我們面前,讓我們看到了全球的社交環(huán)境,看到了人與人之間的關(guān)系。今天我們已經(jīng)有了非常時(shí)髦的大數(shù)據(jù),其實(shí)我們更多的人談的是大數(shù)據(jù)時(shí)代,但是對(duì)于我來講,我把大數(shù)據(jù)主要分成這樣四個(gè)領(lǐng)域,第一個(gè)就是Data Science,有人說21世紀(jì)最性感的職業(yè)是數(shù)據(jù)科學(xué)家。在這里面我們還涉及到一個(gè)網(wǎng)絡(luò)科學(xué),人與人之間的關(guān)系,我們把它叫做社會(huì)網(wǎng)絡(luò)。還有一個(gè)就是每天拿著手機(jī),我們會(huì)移動(dòng),這些基于MDS、經(jīng)緯度,你的位置,以及你坐落的位置的空間環(huán)境,形成了一個(gè)空間地理科學(xué)的領(lǐng)域。今天我們會(huì)關(guān)注于一個(gè)叫可視化的技術(shù),有人說大數(shù)據(jù)有三V,大數(shù)據(jù)有四V,其實(shí)大數(shù)據(jù)還有五V,就是可視化,因?yàn)橹挥锌吹靡姴拍茏龅玫健F鋵?shí)大數(shù)據(jù)技術(shù)更新非???,特別是從開源以來。在這個(gè)過程中,我們可以看到大數(shù)據(jù)在可視化技術(shù)上提供了各種各樣的平臺(tái),我們非常容易的去使用這些平臺(tái)。過去都需要在機(jī)房去配置所謂的運(yùn)營,或者叫做高性能系統(tǒng)、運(yùn)行系統(tǒng)或者云端。我們今天很容易地感知到的一個(gè)關(guān)系是什么,我們看到在這個(gè)關(guān)系里面,實(shí)際上可以很清楚的追蹤一個(gè)信息的擴(kuò)散或者一個(gè)人的關(guān)系。
對(duì)數(shù)據(jù)新聞,我們?cè)诓粩鄧L試如何把可視化技術(shù)運(yùn)用到新聞中。上面這張圖是兩會(huì)期間,人民網(wǎng)做的實(shí)時(shí)輿情展示。如何從網(wǎng)上實(shí)時(shí)抓取李克強(qiáng)總理兩會(huì)報(bào)道的實(shí)況,然后把這樣的信息呈現(xiàn)在屏幕上,這涉及到如何實(shí)現(xiàn)分子技術(shù),如何實(shí)現(xiàn)主題模型,如何能夠把這些信息展現(xiàn)出來。主題詞的展現(xiàn)有個(gè)問題,萬一屏幕上跳出一個(gè)敏感詞,我們就要找導(dǎo)播的問題了。所以對(duì)于互聯(lián)網(wǎng)來講,特別是對(duì)傳統(tǒng)媒體來講,媒體的內(nèi)容如何保證正常播出和安全播出,這變得很重要。同樣的道理,如何在可視化和制作數(shù)據(jù)新聞的過程中,把可視化內(nèi)容放在電視上呈現(xiàn)。在可視化內(nèi)容中,曾經(jīng)有百度遷徙,我們認(rèn)為這是當(dāng)時(shí)中國的老百姓第一次能夠通過媒體,特別是電視媒體感知到這樣的大數(shù)據(jù)應(yīng)用。后來春晚的時(shí)候,東莞掃黃,從那個(gè)圖上可以看到東莞的人能往哪兒跑,這就讓可視化更火了。大數(shù)據(jù)最重要的一點(diǎn),你不會(huì)做挖掘,但是你能看得懂,只有制作者看得懂了,才能把從數(shù)據(jù)中獲得的信息讓老百姓也看得懂,今天的大數(shù)據(jù)很多挖出來的東西都是可以讓我們的受眾看到。這時(shí)候我們發(fā)現(xiàn)我們的領(lǐng)導(dǎo)也看到了,中央臺(tái)訪問調(diào)研的時(shí)候,就特別指示一定要加強(qiáng)兩會(huì)大數(shù)據(jù)報(bào)道。
但是我們的電視媒體不懂什么叫大數(shù)據(jù),什么叫數(shù)據(jù)新聞。所以這就使我萌發(fā)了一個(gè)想法,我們需要既懂新聞,又能夠從數(shù)據(jù)的視角去觀察的人才。正好得到學(xué)校領(lǐng)導(dǎo)的大力支持,我們就立刻創(chuàng)建了數(shù)據(jù)新聞這個(gè)專業(yè)。但是數(shù)據(jù)新聞實(shí)際上它更多的是什么呢?是新聞還是數(shù)據(jù)?過去這兩個(gè)職業(yè),或者兩個(gè)學(xué)科,甚至是相互抵觸的,就像文科和理科。我們希望培養(yǎng)的是具有可視化能力,我叫數(shù)據(jù)工匠。只有看得見才能做得到,才能做得好。今天是媒介融合的時(shí)代,也需要媒體人也具有這樣的融合。除了在計(jì)算上的word、ppt的制作,今天媒體人可能要學(xué)會(huì)編程了,我們能不能用R語言解決問題,能不能進(jìn)行藝術(shù)性的設(shè)計(jì),如何去實(shí)現(xiàn)數(shù)據(jù)可視化。當(dāng)然我說一句話叫形式大于內(nèi)容,在有內(nèi)容的前提下,怎么才能讓形式大于內(nèi)容。其實(shí)數(shù)據(jù)可視化包括各種可視化,比如說空間可視化、城市可視化、交通可視化,我們一直在嘗試著不同的可視化技術(shù)和手段,包括Excel圖表的可視化。
在這個(gè)過程中,你會(huì)發(fā)現(xiàn)我們有很多內(nèi)容需要可視化呈現(xiàn)。像我們媒體的收視率,在2006年我就在研究如何在PPT上實(shí)現(xiàn)可視化,如何選擇可視化展現(xiàn)這樣的動(dòng)態(tài)過程。可視化在今天如何能夠跟大數(shù)據(jù)產(chǎn)生融合呢?其實(shí)在數(shù)據(jù)驅(qū)動(dòng)的商業(yè)變革和經(jīng)營創(chuàng)新中一直有可視化,我們把它叫做商業(yè)智能,數(shù)據(jù)可視化可以涵蓋整個(gè)大數(shù)據(jù)或者商業(yè)決策。我們需要有更好的可視化方式,呈現(xiàn)在今天廣電的媒體上,我們希望能夠通過數(shù)據(jù)可視化的模式,讓可視化深入到我們認(rèn)知數(shù)據(jù)的模式中。我曾經(jīng)做過個(gè)人的肖像,中央臺(tái)也曾對(duì)每一個(gè)主持人制作了個(gè)性的標(biāo)簽和畫像;也可以對(duì)文本進(jìn)行相應(yīng)的分析,研究兩會(huì)政府工作報(bào)告,研究習(xí)近平的講話,通過中文或者自然語言的處理,看到它所具有的報(bào)道價(jià)值在什么地方;我們也可以對(duì)一條信息,或者對(duì)一種關(guān)系追尋其傳播,像右邊這個(gè)是信息傳播到五萬條的時(shí)候,我把信息抓下來形成的信息可視化,從這里面我們可以更好的去洞察和感知到這樣的一個(gè)信息呈現(xiàn);包括如果我們拿到北京市人們的POI,無論是移動(dòng)的或者其他的類型,我們完全可以算出任何區(qū)域內(nèi)的人流量,或許我們可以通過對(duì)數(shù)據(jù)的分析,尋找到智慧的足跡,看到我們的消費(fèi)者,我們的受眾在什么環(huán)境里面。
當(dāng)然我們可以觀察這樣一些數(shù)據(jù)的點(diǎn),由此可以看到人們的行動(dòng)軌跡,我們利用百度,利用騰訊,利用谷歌的實(shí)景地圖,實(shí)時(shí)觀察到在這個(gè)位置上有多少人。甚至我們可以獲得更加精細(xì)的地圖導(dǎo)航,只要你打入電話,立刻可以回轉(zhuǎn)到這個(gè)人在什么位置。如何把一個(gè)消費(fèi)者能夠以他的社會(huì)關(guān)系,他的智慧足跡,他的居住行為,他的娛樂活動(dòng)整合在一起,呈現(xiàn)在我們面前,呈現(xiàn)在我們的決策者面前,這是非常重要的領(lǐng)域。所以數(shù)據(jù)可視化本身就是數(shù)據(jù)分析,數(shù)據(jù)可視化本身也是一種敘事手段,數(shù)據(jù)可視化本身也是一種低碳性的思維方式。我們希望能夠在廣電,在傳媒,培養(yǎng)更多懂新聞的,能夠去處理數(shù)據(jù)的數(shù)據(jù)工匠。我覺得掌握一種技能,成為工匠是非常了不起的。所以我們可以通過檢測全球的新聞事件,來由此感知這個(gè)社會(huì)到底是什么樣。比如我們?cè)O(shè)想,能不能從全球的新聞事件中去感知我們的一帶一路,感知這個(gè)社會(huì),國與國之間的關(guān)系。數(shù)據(jù)新聞?dòng)幸环N說法——當(dāng)然這個(gè)說法可以大家去查的——互聯(lián)網(wǎng)之父蒂姆說的“未來的新聞是分析數(shù)據(jù)”,這點(diǎn)我不知道大家怎么講,但是從側(cè)面可以看到數(shù)據(jù)對(duì)新聞的驅(qū)動(dòng)。
數(shù)據(jù)新聞是從2010年興起的,我們的很多媒體特別是以互聯(lián)網(wǎng)為代表的新媒體上,都成立了數(shù)據(jù)新聞工作室。這個(gè)趨勢在中國的出現(xiàn)是2013年左右,或者更早。大數(shù)據(jù)興起后,催生了數(shù)據(jù)新聞的發(fā)展。我們可以看到數(shù)據(jù)新聞最先在國內(nèi)普及主要還是在網(wǎng)絡(luò)和新媒體,包括百度、網(wǎng)易等等。其實(shí)數(shù)據(jù)新聞跟傳統(tǒng)的新聞它的本質(zhì)依然是新聞,因?yàn)槭切侣劊晕覀兙鸵獜?qiáng)調(diào)新聞的選題,強(qiáng)調(diào)新聞的敘事能力,只不過在中間增加了一個(gè)數(shù)據(jù)的采集、數(shù)據(jù)的處理和可視化的環(huán)節(jié),特別是我們強(qiáng)調(diào)了一種可視化的能力,使得我們的受眾能夠通過可視化的表現(xiàn),快速地去理解我們所想表達(dá)的東西。曾經(jīng)的定義說數(shù)據(jù)新聞就是把傳統(tǒng)的新聞敏感性和有說服力的敘事能力,與海量的數(shù)字信息相結(jié)合創(chuàng)造了一種新的課題。傳統(tǒng)的新聞是新近發(fā)生事實(shí)的報(bào)道,但是我們看到記者今天不用天天的再去追暴風(fēng)雪了,不用去現(xiàn)場了,有一類記者叫數(shù)據(jù)新聞?dòng)浾?。他每天就在互?lián)網(wǎng)上尋找全球的信息,尋找他所合作的那些開放大數(shù)據(jù)源,由此去挖掘出值得報(bào)道的故事。數(shù)據(jù)新聞的發(fā)展歷史跟早期的計(jì)算機(jī)普通報(bào)道、精確新聞?dòng)兄幻}相承的邏輯,但因?yàn)榇髷?shù)據(jù)時(shí)代的來臨,本質(zhì)上數(shù)據(jù)新聞已經(jīng)完全跟傳統(tǒng)的精確新聞不同了。
我們看到過去在信息不足的情況下,需要記者集中精力去獲取信息,但是今天不僅記者獲得的信息龐雜,對(duì)受眾來講也是這樣。如何從數(shù)據(jù)中尋找分析不斷變化的數(shù)據(jù),找到它的意義和結(jié)構(gòu),或者說能夠展示數(shù)據(jù),讓受眾去了解這個(gè)信息的重要性和相關(guān)性。數(shù)據(jù)新聞?dòng)锌茖W(xué)性的一面,換句話說大數(shù)據(jù)時(shí)代可以讓傳播學(xué)變得越來越科學(xué),甚至讓社會(huì)科學(xué)變得越來越科學(xué)。數(shù)據(jù)新聞的層次包括內(nèi)容可視化和挖掘新聞。
內(nèi)容可視化是以內(nèi)容呈現(xiàn)圖表化為代表,將報(bào)道的內(nèi)容可視化,使用諸如圖表、信息圖等方式配合簡單文字描述進(jìn)行報(bào)道,其表達(dá)的含義簡潔易懂,符合人類大腦接收信息的習(xí)慣;
挖掘新聞是以數(shù)據(jù)挖掘?yàn)榇?,即從海量的?shù)據(jù)信息中挖掘出有新聞價(jià)值的部分,然后經(jīng)過新聞加工整合成為一篇報(bào)道,這樣的新聞具有調(diào)查報(bào)道和深度報(bào)道的優(yōu)點(diǎn),可以更加客觀公正的守望社會(huì)。
在這里面我們可以看到,其實(shí)數(shù)據(jù)新聞的層次就是要從內(nèi)容上去挖掘,有一種說法說數(shù)據(jù)新聞可以歸類到我們的深度報(bào)道,當(dāng)然數(shù)據(jù)新聞也可以歸類到我們的數(shù)據(jù)可視化,或者基于大數(shù)據(jù)可視化的技術(shù)。當(dāng)前國內(nèi)外在數(shù)據(jù)新聞上有非常好的合作點(diǎn),我們可以看到國外像紐約時(shí)報(bào)、衛(wèi)報(bào)在這方面有一些做的非常好,在媒體方面也有他的探索,和現(xiàn)在各個(gè)電視臺(tái)差不多,看到他們所碰到的問題跟我們今天所碰到的問題是一樣的,在這里面我們會(huì)發(fā)現(xiàn),有很多類似的比如說MH370找不著了,比方說前一段時(shí)間財(cái)新做的周永康事件的追蹤脈絡(luò),當(dāng)然他們更重要的還是通過H5和手機(jī)移動(dòng)端傳播的。最近我們看到,如何在網(wǎng)頁上的實(shí)現(xiàn)是不是能夠在電視上實(shí)現(xiàn),這里面涉及到電視節(jié)目制作的過程,就像我們的背板,電視臺(tái)用的背板是藍(lán)色或者綠色,但是我們的制作用其他顏色就沒法實(shí)現(xiàn),如何讓我們的生產(chǎn)流程適用廣電,這還有一個(gè)探索的過程。在這里面有很多類似于這樣的分析技術(shù)和可能的實(shí)現(xiàn)技術(shù),將會(huì)重現(xiàn)在我們面前,包括我們看到的,像我們?cè)趯W(xué)生中做了很多,做了幾百個(gè)各種各樣的報(bào)道方式,成立了數(shù)據(jù)可視化的興趣小組。一篇報(bào)道該如何去實(shí)現(xiàn),這里面可能涉及到地理空間的分析,包括文本的分析等等,這些東西都需要我們學(xué)新聞的學(xué)生能夠去掌握。
但這面臨著兩大難題,一方面是我們學(xué)生的文理是比較分明的,家長在培養(yǎng)孩子的時(shí)候沒有意識(shí)到這一點(diǎn)。另一方面我們自己的學(xué)生也會(huì)有這樣的抵觸,比如會(huì)擔(dān)心這個(gè)東西我能不能學(xué)會(huì)。其實(shí)今天的工具都開源了,工具越來越成為工具,而且非常容易使用,我們的文科生、新聞系的學(xué)生大概需要半天的時(shí)間,就能制作出非常漂亮的可視化作品——是不是新聞作品我們還在努力——制作方面他們已經(jīng)可以做到。把獲取新聞,數(shù)據(jù)的分析和可視化的呈現(xiàn)融合在一起,是我們的一個(gè)努力方向。我們也希望能夠有更多的人才,不光傳媒大學(xué),其實(shí)武漢大學(xué)、復(fù)旦大學(xué)、其他的新聞學(xué)院,也都開始涉足或者培養(yǎng)這方面的人才。相信用不了多長時(shí)間,我們國內(nèi)在廣電上會(huì)有一些人才,在數(shù)據(jù)新聞?lì)I(lǐng)域,甚至我們馬上進(jìn)入的機(jī)器人新聞報(bào)道領(lǐng)域,會(huì)有比較好的突破。當(dāng)然我們也希望他們能掌握無人機(jī),掌握VR,掌握AR,這些都是新媒體的趨勢,當(dāng)然這種趨勢也可能是這兩年最時(shí)髦的一種趨勢。