莫凡
摘 要 數(shù)據(jù)新聞豐富了新聞生產(chǎn)實踐,大數(shù)據(jù)新聞在選題、事實判斷、信息呈現(xiàn)、信息訂制與推送上展現(xiàn)了與傳統(tǒng)新聞形態(tài)無可比擬的優(yōu)勢。我國進行數(shù)據(jù)新聞的嘗試已5年有余,依然存在不少認識和操作的誤區(qū)。文章通過對數(shù)據(jù)新聞的發(fā)展現(xiàn)狀及帶來的變革進行梳理,反思在數(shù)據(jù)新聞實踐中還有哪些問題值得深入探討。
關(guān)鍵詞 大數(shù)據(jù);數(shù)據(jù)新聞;精準(zhǔn)定位;“長尾內(nèi)容”
中圖分類號 G2 文獻標(biāo)識碼 A 文章編號 2096-0360(2018)08-0035-03
“互聯(lián)網(wǎng)+”時代,數(shù)據(jù)成為各行各業(yè)關(guān)注的焦點,新聞傳播行業(yè)亦不例外。2014年伊始央視利用大數(shù)據(jù)思維對春運進行報道,同年3月,人民日報對“兩會”系列專題也利用了數(shù)據(jù)新聞的操作方式進行報道,國內(nèi)媒體開始大面積嘗試數(shù)據(jù)新聞。然而,經(jīng)過幾年的發(fā)展,我國新聞界在嘗試數(shù)據(jù)新聞的過程中,不少認識、理解和操作的誤區(qū)依然大面積存在,因此通過對數(shù)據(jù)新聞現(xiàn)狀以及對其帶來的新聞理念和新聞業(yè)務(wù)的變革進行梳理,反思數(shù)據(jù)新聞的未來發(fā)展就顯得尤為重要。
1 數(shù)據(jù)新聞實踐現(xiàn)狀
1.1 混淆“數(shù)據(jù)新聞”與“大數(shù)據(jù)新聞”
縱觀最近幾年的傳媒實務(wù),在重大題材的報道里,比如每年的兩會,都有數(shù)據(jù)解讀、圖表分析等報道樣式,學(xué)業(yè)界普遍認為這是對大數(shù)據(jù)新聞的有益實踐。但如果認真區(qū)分,我們不難發(fā)現(xiàn),這些常見的樣式我們可以稱之為精確新聞、圖表新聞或者數(shù)據(jù)新聞,卻難以歸為“大數(shù)據(jù)新聞”。舍恩伯格在《大數(shù)據(jù)時代》這樣概括大數(shù)據(jù)的特征:不是隨機樣本,而是所有數(shù)據(jù);不是精確性,而是混雜性;不是因果關(guān)系,而是相關(guān)關(guān)系。目前的數(shù)據(jù)新聞實踐,無論從數(shù)據(jù)的全面性、多樣性、相關(guān)性,都不屬于大數(shù)據(jù)的范疇。
以新華網(wǎng)數(shù)據(jù)新聞2018年3月發(fā)布的幾篇文章為例,無論是涉及民生的《無肉不歡?那可能是過去時了》,還是科普文章《“區(qū)塊鏈”大熱,花幾分鐘了解一下》,所涉及的數(shù)據(jù)皆是局部而非整體,呈現(xiàn)多位因果關(guān)系而忽略其他關(guān)系,是數(shù)據(jù)新聞而非大數(shù)據(jù)新聞。在新華網(wǎng)數(shù)據(jù)新聞?wù)麄€3月的報道中,唯一勉強算作大數(shù)據(jù)新聞的是《“區(qū)塊鏈”大熱,花幾分鐘了解一下》,文章設(shè)置了“大事件回顧”“數(shù)讀現(xiàn)狀”“技術(shù)特性”“投資情況”“應(yīng)用領(lǐng)域”5個板塊,這些板塊中,現(xiàn)狀和投資兩個部分的數(shù)據(jù)運用了和這兩個主題相關(guān)的全部數(shù)據(jù),而非“抽樣”數(shù)據(jù),符合大數(shù)據(jù)新聞的全面性要求。但遺憾的是,該文章的“應(yīng)用領(lǐng)域”板塊,只列舉了供應(yīng)鏈和物聯(lián)網(wǎng)、金融業(yè)、網(wǎng)絡(luò)安全等六個領(lǐng)域,只有簡單的百分比,缺少更詳細的數(shù)據(jù),更缺少做得好的企業(yè)的完全統(tǒng)計,該文章雖是大數(shù)據(jù)新聞但質(zhì)量不高。
將“大數(shù)據(jù)新聞”與“數(shù)據(jù)新聞”等同操作,是目前媒體普遍存在的一種狀況。大數(shù)據(jù)新聞只是數(shù)據(jù)新聞的一種,大數(shù)據(jù)新聞一定需要符合大數(shù)據(jù)的全面性、混雜性、相關(guān)性要求,也要符合操作過程中數(shù)據(jù)是來源、數(shù)據(jù)是表達方式、數(shù)據(jù)是結(jié)論的佐證方式等基本要求。
1.2 將含有數(shù)字的新聞報道都等同于數(shù)據(jù)新聞
計算機科學(xué)認為,數(shù)據(jù)是事實或觀察的結(jié)果,是客觀事物的邏輯歸納,是用于表示客觀事物的未經(jīng)加工的原始素材。數(shù)據(jù)新聞里提到的“數(shù)據(jù)”,應(yīng)該是一種廣義上的數(shù)據(jù),一部分指以數(shù)字符號形式呈現(xiàn)的內(nèi)容,另一部分指數(shù)字背后所涉及到的關(guān)聯(lián)影響。
從本文上一個問題的論述中,我們可以發(fā)現(xiàn)數(shù)據(jù)新聞與一般新聞報道對數(shù)字的零星使用不同,數(shù)據(jù)新聞從發(fā)現(xiàn)主題和表達主題上,都是數(shù)據(jù)為主角,無論是從一開始的新聞價值發(fā)現(xiàn)還是到最后的新聞主題呈現(xiàn)方式,都離不開數(shù)據(jù),更離不開與數(shù)據(jù)相關(guān)的各種技術(shù)。
數(shù)據(jù)新聞的操作核心是運用數(shù)據(jù)思維去發(fā)現(xiàn)和報道新聞事實。只要符合這個前提,即便通篇都是文字的報道,只要能密切圍繞數(shù)據(jù)來組織報道,同樣也是數(shù)據(jù)新聞,而沒有用這種操作理念進行的新聞報道,即便通篇都是數(shù)據(jù),也不能稱之為數(shù)據(jù)新聞。
1.3 數(shù)據(jù)來源難保證,缺乏與各自媒體的融合
筆者通過對搜狐“數(shù)字之道”、新華網(wǎng)“數(shù)據(jù)新聞”2017年1月1日到2018年3月28日發(fā)表的數(shù)據(jù)類新聞進行統(tǒng)計,通過其題材、地域、數(shù)據(jù)來源、閱讀量、評論量等進行統(tǒng)計分析,以期更客觀地得出關(guān)于數(shù)據(jù)新聞的現(xiàn)狀。搜狐《數(shù)字之道》在此期間,共發(fā)表文章184篇,其中國內(nèi)158篇,國際26篇,最高閱讀量是2017年10月17日文章《各位黨員請注意,有一個神秘箱子等你查收》,閱讀人數(shù)432萬;數(shù)據(jù)來源最多的是2017年4月13日《美410萬華人超五成高學(xué)歷,真的在被歧視?》,5個數(shù)據(jù)來源(World Library,美國人口統(tǒng)計局(2015年)、美國之音、Pew Research、Committee of 100)。新華網(wǎng)《數(shù)據(jù)新聞》在此期間,共發(fā)表文章502篇,其中國內(nèi)489,國際13篇,最高點贊量文章是《習(xí)近平金句·奮斗》(新華網(wǎng)頁面不顯示閱讀人數(shù))9 009(截至2018年3月29日);數(shù)據(jù)來源最多為2017年8月11日文章《文藝、新聞輿論、網(wǎng)絡(luò)文化、哲學(xué)社科 習(xí)近平如何看待這些領(lǐng)域》,12個數(shù)據(jù)來源(新華網(wǎng)、中國政府網(wǎng)、環(huán)保部、央視、中國環(huán)境報、人民日報、工人日報、檢察日報、中青報、中新網(wǎng)、環(huán)衛(wèi)科技網(wǎng)、中國人民大學(xué))。
通過分析,我國數(shù)據(jù)新聞的閱讀量、互動性普遍較差,最明顯的是數(shù)據(jù)質(zhì)量較差,具體表現(xiàn)為來源處單一、陳舊,語焉不詳?shù)奶卣?。究其原因,首先是?shù)據(jù)作為一種重要的資源,掌握在少數(shù)的大公司手里,傳統(tǒng)媒體并不占有數(shù)據(jù),傳統(tǒng)媒體只能利用政府公開的數(shù)據(jù),但我國政府公開數(shù)據(jù)的能力有限,因此即便是新華社、搜狐之類的全國性大媒體,在進行數(shù)據(jù)新聞報道的時候依然有很強的壁壘。其次還有網(wǎng)絡(luò)水軍、網(wǎng)絡(luò)的言論監(jiān)管、網(wǎng)名的過于情緒化發(fā)聲,使得我們獲取的原始數(shù)據(jù),尤其是和意見性質(zhì)相關(guān)的數(shù)據(jù),難免主觀性過強,無論是數(shù)據(jù)質(zhì)量和數(shù)量都不能滿足我們當(dāng)前數(shù)據(jù)新聞報道的需要。
與此同時,我們目前對數(shù)據(jù)仍以淺層次的應(yīng)用為主,呈現(xiàn)方式仍以數(shù)據(jù)來源方提供的原始形態(tài)或者僅僅是獲得數(shù)據(jù)的簡單加工,缺乏與各自媒體的融合。無論是新華網(wǎng)的“數(shù)據(jù)新聞”欄目、搜狐的“數(shù)字之道”欄目,還是被看作是中國大數(shù)據(jù)新聞報道典范的央視“‘據(jù)說春運”節(jié)目此方面都欠缺。以“‘據(jù)說春運”為例,央視2014年便開始使用LBS(基于位置的服務(wù))定位可視化數(shù)據(jù),播報我國春節(jié)人口遷徙情況。在此系列報道中,數(shù)據(jù)通過信息表格、動態(tài)圖的形式進行畫面呈現(xiàn),主持人對這些圖表加以闡述進行報道,但仔細觀察,會發(fā)現(xiàn)無論出現(xiàn)在新聞中的“遷徙動態(tài)圖”,還是根據(jù)數(shù)據(jù)做出的簡單的“地區(qū)人口出入增長圖”,大部分都是直接來源于數(shù)據(jù)提供方,這些圖表皆是拿來就用,缺乏與各自媒體的契合??v觀目前大部分數(shù)據(jù)新聞,幾乎所有的媒體用的都是同一張圖,缺乏和各自媒體的真正融合,更缺乏深刻解讀。
2 數(shù)據(jù)新聞實踐影響
大數(shù)據(jù)作為一種新的動力注入新聞業(yè),使新聞生產(chǎn)實踐產(chǎn)生了新的變化,也拓展了傳統(tǒng)新聞類型的報道邊界,在用戶分析、內(nèi)容價值等多方面都產(chǎn)生了深遠的影響。
2.1 大數(shù)據(jù)將用戶的精準(zhǔn)性分析變成常態(tài)
用戶的行為數(shù)據(jù)、用戶生產(chǎn)的內(nèi)容,無疑都是現(xiàn)在大數(shù)據(jù)的重要來源,這些數(shù)據(jù)反過來重新被運用到新聞生產(chǎn)中,這種用戶和內(nèi)容的強連接關(guān)系是以往任何一種形式的新聞報道都無法比擬的。
以大數(shù)據(jù)對用戶的分析為例,傳統(tǒng)的受眾調(diào)查多以抽樣的問卷調(diào)查方式,樣本量有限,成本高,周期長,無論是內(nèi)在效度還是外在效度都很低,這樣的數(shù)據(jù)很難支持新聞的生產(chǎn)決策。而大數(shù)據(jù)可以直接抓取或者支持更多的受眾參與調(diào)查,較高的效率和較低的成本使得編輯在日常中迅速挖掘熱點并完成選題,并且大數(shù)據(jù)分析不是要求用戶對他們的行為習(xí)慣以問卷的方式做出回答,而是對他們?nèi)粘5淖园l(fā)行為本身進行收集,這樣的分析具有更真實、更全面的特征,因此將傳統(tǒng)媒體不可能進行的全樣本、跨平臺分析變成了現(xiàn)實。
發(fā)展到現(xiàn)階段的媒體都已經(jīng)開始對用戶群體細分。傳統(tǒng)媒體的用戶細分多為一些簡單的人口指標(biāo)劃分,例如年齡、性別、地域、收入等,而數(shù)據(jù)算法的使用可以將他們各種指標(biāo)特征與他們的態(tài)度、行為、價值偏好以及生活工作場景聯(lián)合起來,形成一個更完整、立體、貼近現(xiàn)實的用戶畫像,實現(xiàn)了對每個個體用戶的定向精準(zhǔn)分析。
值得注意的一點是,數(shù)據(jù)的使用在新聞傳播過程中除了用于用戶畫像,也廣泛運用于精準(zhǔn)推送,這種推送會是使個人接觸到的信息無形中越來越偏向于自己感興趣的領(lǐng)域,推送的內(nèi)容會打著個性和精準(zhǔn)的名目越來越窄化,“信息繭房”效應(yīng)會越來越明顯。
2.2 大數(shù)據(jù)帶來的定向新聞推送的新范式,數(shù)據(jù)作為推送的依據(jù),激活了新聞生產(chǎn)的“長尾內(nèi)容”
大數(shù)據(jù)的使用,可以使得用戶任何時間任何節(jié)點在網(wǎng)絡(luò)上遺留下來的信息都能被記錄、分析和聚合。以用戶使用社交網(wǎng)站為例,大數(shù)據(jù)技術(shù)可以根據(jù)用戶在社交網(wǎng)站上發(fā)布的內(nèi)容以及所屬類別、用戶自標(biāo)簽、社會關(guān)系、社交行為,以及參與的群組、機型、使用時間等數(shù)據(jù)源,輕易地發(fā)現(xiàn)用戶的興趣點,并根據(jù)這些興趣的重要程度或者先后順序進行推送,不僅能實現(xiàn)用戶和信息之間的精確匹配,也很容易為用戶找到新的群組,增強用戶與信息之間的黏性,用戶與用戶之間的黏性。
在這個過程中,通過對數(shù)據(jù)的挖掘,原來被忽視的大量的長尾信息被挖掘,這些非主流、個性化的產(chǎn)品需求,雖然是需求的尾巴,但是經(jīng)過散落在社會各個角落中的用戶的累積,大量傳統(tǒng)的處于尾部的新聞資源和價值被重新重視,激活了新聞生產(chǎn)的“長尾內(nèi)容”。在數(shù)據(jù)支持下的精準(zhǔn)推送和需求聚合,內(nèi)容和用戶更容易形成強連接關(guān)系,也容易使得以往被忽視的用戶“小眾需求”被重現(xiàn)發(fā)現(xiàn)和滿足。
2.3 數(shù)據(jù)新聞帶來了新的權(quán)力中心
很多學(xué)者認為,數(shù)據(jù)新聞的產(chǎn)生從一定程度上打破了媒介權(quán)力的壟斷,弱化了精英階層對媒介新聞話語權(quán)的壟斷,認為數(shù)據(jù)新聞是一種以客觀數(shù)據(jù)為發(fā)現(xiàn)新聞線索的方式,在寫作和表達的過程中是一種去除了傳統(tǒng)固定采訪路線和表現(xiàn)方式的新型模式,這種去除是對精英階層在新聞生產(chǎn)中話語權(quán)的消解,是一種“去中心化”的新聞專業(yè)主義實踐。
但是,“互聯(lián)網(wǎng)+”時代,數(shù)據(jù)被稱作為“石油”,由此可以看出來數(shù)據(jù)的重要戰(zhàn)略資源地位。在我國,很明顯許多調(diào)查新聞的數(shù)據(jù)源是被個別大型商業(yè)機構(gòu)壟斷的,是不可能被公開的,這就意味著,獲取數(shù)據(jù)的高技術(shù)、高成本門檻其實將大多數(shù)的傳統(tǒng)新聞機構(gòu)拒之門外,媒體規(guī)模和資源成為媒體實踐數(shù)據(jù)新聞的決定性因素。因此,具有數(shù)據(jù)生產(chǎn)能力的機構(gòu)掌握了大部分用戶的數(shù)據(jù)信息,只要想利用數(shù)據(jù),就繞不開這些機構(gòu),長此以往,勢必會形成新的權(quán)力中心。
另外,數(shù)據(jù)的產(chǎn)生過程本身也是一種更偏向于某種權(quán)力的過程。麗莎特曼在《原始數(shù)據(jù)只是一種修辭》所說,“數(shù)據(jù)從來不可能是原始存在的,因為它不是自然的產(chǎn)物,而是依照一個人的傾向和價值觀被構(gòu)建出來的。我們最初定下的采集數(shù)據(jù)的辦法已經(jīng)決定了數(shù)據(jù)將來以何種面貌呈現(xiàn)出來。數(shù)據(jù)分析的結(jié)果看似公正客觀,其實價值選擇貫穿了構(gòu)建到解讀的全過程”。作為個人而言,網(wǎng)絡(luò)中的活躍分子和意見領(lǐng)袖們的意見更容易形成數(shù)據(jù)來源,而“沉默的大多數(shù)”容易被忽略,因此,數(shù)據(jù)的產(chǎn)生本身自帶權(quán)力的偏向性。
因此,無論是作為機構(gòu)還是個人本身,數(shù)據(jù)從被構(gòu)建和發(fā)掘開始就已經(jīng)帶有了明顯的權(quán)力中心特征。數(shù)據(jù)新聞生產(chǎn)方,要么是強勢傳統(tǒng)媒體,要么是網(wǎng)絡(luò)巨頭麾下為商業(yè)利益服務(wù)的互聯(lián)網(wǎng)產(chǎn)品,由此可見,生產(chǎn)權(quán)力還是主要集中在少數(shù)機構(gòu)和部分人手中,無論是從財力、技術(shù)手段還是數(shù)據(jù)的產(chǎn)生上,都是表面上的“去中心化”,實際上形成了新的權(quán)力中心。
3 數(shù)據(jù)新聞的反思
經(jīng)過幾年的發(fā)展,數(shù)據(jù)新聞的實踐對新聞思維還是操作理念都做出了有益的補充,也激發(fā)了對傳統(tǒng)新聞生產(chǎn)模式的更新和改造,在數(shù)據(jù)發(fā)掘的幫助下,媒體很容易從碎片化的信息發(fā)現(xiàn)規(guī)律和趨勢,發(fā)現(xiàn)新聞要素的相關(guān)性,報道的廣度和深度也得以加深,自然語言處理、機器學(xué)習(xí)、圖像識別、神經(jīng)網(wǎng)絡(luò)等人工智能技術(shù)也將為數(shù)據(jù)新聞的生產(chǎn)提供更多的創(chuàng)新可能,數(shù)據(jù)新聞報道常態(tài)化的趨勢已經(jīng)異常明朗。
基于此,我們對于數(shù)據(jù)新聞可能帶來的問題的反思也愈加重要。我們?nèi)绾潍@得更全面、更客觀的數(shù)據(jù)?如何補足數(shù)據(jù)新聞人情味欠缺的短板?數(shù)據(jù)新聞可視化的表達方式會不會帶來新聞的過于簡化?數(shù)據(jù)的生產(chǎn)過程和使用都對精英階層更加友好,是否會加劇“數(shù)字鴻溝”?濃縮要點式的報道、新聞圖表的直觀表達、深度的解讀形式所帶來的輕量化閱讀體驗,雖然符合我們現(xiàn)在的媒介使用習(xí)慣,但是長此以往會不會影響讀者的思辨能力?根據(jù)用戶需求提供的個性化定制新聞和推送新聞的大數(shù)據(jù)服務(wù),雖然完成了傳統(tǒng)大眾傳媒無法實現(xiàn)的“長尾內(nèi)容”傳播,發(fā)現(xiàn)了媒體新的商業(yè)增值點,但是會不會加重“信息繭房”?隨著定位技術(shù)的發(fā)展,一方面是遺留于網(wǎng)絡(luò)的信息更容易被他人所掌握,另一方面是公民對于個人權(quán)利重視意識也日益提升,信息公開與隱私保護矛盾該如何調(diào)和?如何更加充分發(fā)揮數(shù)據(jù)新聞的用戶思維,即滿足對用戶信息獲取需求的充分關(guān)注,對社會問題、社會趨勢的準(zhǔn)確揭示與深入剖析的要求,也能滿足尊重用戶,將用戶納入數(shù)據(jù)新聞的選題決策和生產(chǎn)體系中去的要求?
作為一種新的新聞生產(chǎn)實踐,數(shù)據(jù)新聞將更多創(chuàng)新與潛能注入新聞業(yè),數(shù)據(jù)新聞承載著新聞界的許多期待,也有更多的領(lǐng)域值得反思探討。