文|辛 梓 杜志紅
我們生活在一個一切事物都可以被量化的“大數據時代”,對數據的匯集與分析變得尤為重要。如今,大數據在IT、金融領域都已經出現(xiàn)了深入的應用,可視化“數據新聞”的興起則是電視新聞媒體對大數據時代的積極回應。它為我們傳播、接受信息提供了新的視角,形成了一種創(chuàng)新性的新聞表達方式和新聞報道形態(tài)。
2010年8月,在首屆“國際數據新聞”會議上,米爾科·勞倫茲提出:“數據新聞是一種工作流程,包括下述基本步驟:通過反復抓取、篩選和重組來深度挖掘數據,聚焦專門信息以過濾數據,可視化地呈現(xiàn)數據并合成新聞故事。”對此定義,李希光教授則認為,數據新聞學或稱數據驅動的新聞學,是計算傳播學的一個具體應用,通過挖掘和展示數據背后的關聯(lián)與模式,和豐富的、具有互動性的可視化展現(xiàn),數據新聞學成為新聞學的新疆域和應用范例,并作為一門新的新聞分支進入主流媒體。目前,對于可視化“數據新聞”業(yè)界眾說紛紜,尚未有一個統(tǒng)一、權威的概念。筆者認為,若要定義可視化“數據新聞”,首先要明確大數據、數據新聞以及數據可視化三者的概念。
大數據之“大”在于它的海量,即在互聯(lián)網時代產生的數據信息的一個海量的匯集。業(yè)界將大數據的特點歸納為4個“V”:Volume(大量)、Velocity(高速)、Variety(多樣)、Veracity(精確)。這4個“V”足以在短時間內涌現(xiàn)出大量的數據。一組名為“互聯(lián)網上的一天”的數據顯示:一天中,互聯(lián)網產生的全部內容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多,相當于美國兩年的紙質信件數量;發(fā)出的社區(qū)帖子達200萬個,相當于《時代》雜志770年的文字總量。在如此浩瀚的信息海洋中,數據變得大而散,人們無法及時獲取有用的信息,需要專業(yè)的人員去篩選、匯集并及時的發(fā)布。因此,數據新聞應運而生。
數據可視化旨在借助于圖形化手段,清晰有效地傳達與溝通信息。為了有效地傳達思想概念,美學形式與功能需要齊頭并進,通過直觀地傳達關鍵的方面與特征,從而實現(xiàn)對于相當稀疏而又復雜的數據集的深入洞察。幫助受眾迅速定位對自己有用的信息,實現(xiàn)人與數據的互動,通過數據的可視化呈現(xiàn)進行關系的比對、更加深入的分析,幫助受眾更及時而直觀的了解事件的最新動態(tài),也增添了接受新聞的趣味性。
綜合以上幾點,筆者認為:所謂的可視化“數據新聞”,是以大數據為核心,利用軟件工具,對海量數據進行篩選、分析,用可視化技術進行數據的二次加工,最終形成將事件圖形化的呈現(xiàn)給公眾,幫助公眾理解數據背后的相關聯(lián)系,形成一種新的電視新聞報道形態(tài)。
分析圖1我們可以得知,從獲取數據、對數據進行過濾、實現(xiàn)數據的可視化,到最后呈現(xiàn)出一則“可視化”的數據新聞,是一個信息不斷增值的過程。要使信息的價值達到最大化,數據的“可視化”表達是一則數據新聞的核心。
要實現(xiàn)數據電視新聞的“可視化”表達,需要以下四個步驟:
可視化的目的是突出要點,便于受眾理解、記憶。所以在實現(xiàn)數據新聞的可視化之前要進行過濾,經過數據的過濾后,篩選出最有價值的信息,這類信息即為一則數據新聞所報道的核心。例如,2012年“兩會”期間,名為“2012政府工作報告脫水版”的信息圖表,將兩萬字左右“政府工作報告”中的要點濃縮成了幾百字,便于可視化的處理,使得表述更加直觀。實現(xiàn)所報道事物的“可視化”最常用的方法是仿影圖形法。顧名思義,是仿照投影的造型所創(chuàng)意的圖形,并經過省略、歸納,呈現(xiàn)出條理化和幾何化的造型輪廓。
圖1:數據新聞記者Mirko Lorenz曾經提出的數據新聞工作流程
仿影圖形法的基礎是掌握一個事物的形態(tài)特征以及結構組織,在此基礎之上進行一個描摹,它具有極簡化的造型,通俗易懂,符合信息設計的簡練、快速閱讀的特點。用此方法制作的數據新聞能生動形象的呈現(xiàn)新聞主體的特征,便于受眾的理解。在央視的《數字十年》所報道的專題《守住18億畝耕地紅線》中,用禾苗的簡影圖代表農業(yè)用地的概念,用一碗米飯代表所消費的口糧,而用挖掘機、樓房的簡影圖代表工業(yè)建筑用地,直觀形象。
數據本身是中性的,它不存在任何偏向,只有在特定的語境中才被賦予意義。在圖像時代,電視新聞視覺化的意義就是要把單一的數據通過信息化圖表呈現(xiàn)出來,這一過程是電視新聞工作者傳遞、解釋新聞的重要路徑。數據可視化的主要表現(xiàn)形式是信息圖表。根據Doug Newsom的概括,作為視覺化工具的信息圖表包括:圖表(chart)、圖解(diagram)、圖形(graph)、表格(table)、地圖(map)和列表(list)等。以上的可視化處理方法都使數據更加具象化,實現(xiàn)數據的“可視化”的關鍵,就是將“數”的概念轉為“物”的概念。在《守住18億畝耕地紅線》中有一段是這樣表述的:“1996年我國的耕地面積是19.51億畝,到了2001年下降到19.14億畝,這五年來下降了3700萬畝,這相當于四個上海的面積。”由于電視受眾對3700萬畝沒有一個明確的概念,若單純的將數據呈現(xiàn),則不是我們所指的“可視化”數據新聞。
在央視所呈現(xiàn)的“可視化”數據新聞中,設計者以東方明珠代表上海,將下降的3700萬畝轉換為四個上海的城市剪影,使得受眾對數據的感知就更加具體,從而明確事件的嚴重性,樹立保護耕地、減少占用耕地的意識。
除了對具體的數據新聞報道的“可視化”,電視媒體也開始利用“詞云”這一概念,將新聞關注度進行“可視化”的呈現(xiàn)?!霸~云”就是對網絡文本中出現(xiàn)頻率較高的關鍵詞予以視覺上的突出,形成“關鍵詞云層”,從而過濾掉大量的文本信息,使瀏覽網頁者只要一眼掃過文本就可以領略文本的主旨。詞云已成為時下文本關鍵詞、高頻詞分析中一種十分常見的可視化手段。
以央視2014年的“據說兩會”為例,央視創(chuàng)造了一個全新的可視化Logo—“數據哥”(SIR DATA),這是CCTV電視新聞史上第一次出現(xiàn)基于大數據而生成的可視化人形圖像。數據哥以該節(jié)目的主持人顧國寧的照片為剪影,形成一個人形。填充人形的是一個個關鍵詞,而這些具象的關鍵詞正是抽象數據的體現(xiàn)。每天央視的編輯人員通過十大關鍵詞的搜索排行,用制圖軟件來按照關鍵詞的重要性和搜索量兩個維度來進行主次的排列,自行生成“數據哥”形象。受眾可以根據判斷詞的大小、位置、顏色深淺就可以得知大家所關注的事件。中國人民大學輿情所多媒體輿情監(jiān)測顯示, 97%的網民認為“數據哥”的形象準確表達了民眾對“兩會”的真正訴求。這種由“數”到“物”的直觀呈現(xiàn)體現(xiàn)了“民有所呼 會有所應”。
平面媒體上的可視化的信息是靜態(tài)的,單一的。而電視數據新聞“可視化”的表現(xiàn)形態(tài)是連續(xù)的、動態(tài)的、多元的,數據與數據之間、數據與事物之間、事物與事物之間的邏輯關系的清晰呈現(xiàn)就尤為重要。
邏輯關系可視化的主要方法是根據各主體之間的關系,如由多到少、由早到晚、由慢到快等,構建一定的場景,連接各個事物,從而體現(xiàn)邏輯關系。在《數字十年》系列中的《中國網民數世界第一》這則報道中,為了表現(xiàn)近十年來我國的互聯(lián)網普及率一直是上升趨勢,該視頻便設計成由低到高的臺階形狀,臺階的高度與聯(lián)網的普及率成正比,在節(jié)目中,隨著時間軸的不斷推進,臺階的高度不斷遞增,依次出現(xiàn)2008年和2012年兩個比較有代表性的互聯(lián)網普及數,隨后再用柱狀圖作為呈現(xiàn)方式,與全世界的互聯(lián)網普及率相對比。無獨有偶,同樣是在《數字十年》系列中,有個新聞專題是《網絡購物十年增長600倍》,在講到“網店可以將營銷成本降低55%”時,出現(xiàn)兩個柱狀圖,第一個柱狀圖代表著實體店的營銷成本,而第二個柱狀圖代表網店的成本。第二個柱子由與第一個柱子持平慢慢變到第一個柱子一半高,體現(xiàn)成本急劇減少的邏輯關系。在表現(xiàn)以時間或者邏輯關系演變?yōu)橹骶€的新聞上,動態(tài)的數據可視化比靜態(tài)圖表更有表現(xiàn)力,這也是電視媒體“可視化”數據新聞的優(yōu)勢所在。此外,動態(tài)的可視化還可以對災難性新聞進行動畫模擬還原。例如2008年汶川地震后,央視在對堰塞湖的排險和處理過程進行報道時,用動畫的形式對搶險現(xiàn)場和搶險方案進行演示,十分直觀可感。
電視媒體通過非線性編輯連接片段,配上音樂以及解說詞構成一個持續(xù)動態(tài)的視頻信息。連續(xù)性的、動態(tài)可視化展現(xiàn)也是電視媒體有別于報紙雜志之處,電視是集視覺、聽覺為一體的藝術表現(xiàn)形式,聲音、動畫作為節(jié)目包裝的重要組成部分,對視頻的整體效果和信息傳遞效果發(fā)揮著舉足輕重的作用。
加入聲音與動畫,形成動態(tài)的可視化,就是對可視化數據新聞進行后期加工與組織,將內容形象化,信息秩序化的呈現(xiàn)。在2011年,一條由網友制作的短片《十分鐘,讓你了解上海》在互聯(lián)網上走紅。節(jié)目用動畫展現(xiàn)上海的變遷,配上輕松的音樂以及具有磁性的配音,使得城市數據解讀具有趣味性,吸引了大家的眼球。隨后《十分鐘了解中國》《九分鐘了解成都》等用動畫表現(xiàn)大數據的介紹類節(jié)目風靡網絡。如今,央視推出的《據說兩會》《數說十年》等數據新聞類節(jié)目也推出了一系列報道,給“可視化”的數據新聞配上歡快的音樂、口語化的解說、連續(xù)而具有趣味性的動畫演示,給受眾帶來新鮮感。
在生態(tài)系統(tǒng)中,生物食物鏈連接有機生物之間的關系,維持生態(tài)平衡。而在大數據時代,新聞的生產方式基于數據食物鏈。數據食物鏈,指的是大數據新聞在生產過程中,對各種類別和各種來源的數據采集和聚合的過程。
在各個源數據以及各類信息采集平臺聚集數據的過程中,形成了開放數據及資源共享,把記者的范圍擴充為整個公民群體,推動新聞生產的外部化,使“眾包新聞”成為可能,如此,新聞生產也變成一個由單向到多向的循環(huán)過程 。
此外,在大數據時代,除了提升記者個人的能力,使用可視化軟件、構建大數據的多維思維,用數據說話以外,媒體機構也已經有了部門融合的意識,將“傳統(tǒng)媒體人”向“數據媒體團隊”轉變。澳大利亞全國廣播公司(ABC)實現(xiàn)了多部門的人才融合,組建了集合網頁開發(fā)、設計人員、數據采集、分析人員、數據挖掘、圖像可視化技術人員等七類技術人才。央視更是實現(xiàn)了跨界合作,與網絡媒介融合,和百度聯(lián)手制作節(jié)目。央視負責可視化的電視畫面呈現(xiàn)以及后期包裝,百度負責搜集、整合技術,強強聯(lián)手打造出了《數字十年》《據說春運》《據說兩會》等中國電視可視化數據新聞的里程碑式節(jié)目。
雖然不同媒體的數據新聞工作流程各有千秋,但從大方向上來看,都始終都是圍繞著“大數據技術”以及“可視化技術”這兩個核心展開,進行資源的融合。雖然在數據新聞發(fā)展過程中,可視化技術與大數據技術的對接尚未成熟,也存在一系列問題亟待解決,但“可視化”數據新聞橫跨新聞傳播、數據分析、統(tǒng)計、編程、設計等諸多領域,真正體現(xiàn)了“傳媒是科學、技術和藝術的集合”,也由此形成了新的電視新聞報道形態(tài),進一步提升了新聞價值。