王怡人
摘要:本文首先對對大數(shù)據(jù)時(shí)代的數(shù)據(jù)可視化概念進(jìn)行解讀、辨析和研究,在理解了大數(shù)據(jù)與信息可視化的概念之后,闡述了國內(nèi)外研究現(xiàn)狀,總結(jié)現(xiàn)在已有的呈現(xiàn)方式、評估方式、技術(shù)手段和工具,提出了大數(shù)據(jù)時(shí)代下可視化所面臨的挑戰(zhàn)。
關(guān)鍵詞:大數(shù)據(jù);信息可視化;用戶
數(shù)據(jù)信息可視化是近年來不斷發(fā)展的交叉學(xué)科,是藝術(shù)和科技的融合。在如今信息爆炸的時(shí)代,人們接受數(shù)據(jù)的要求是快速、高效、準(zhǔn)確的。設(shè)計(jì)師在設(shè)計(jì)一個(gè)好的數(shù)據(jù)可視化時(shí),在符合信息真實(shí)性的同時(shí),將大量的數(shù)據(jù)通過圖像等手段將抽象難以理解的數(shù)據(jù)整理成受眾方便理解的形式,涉及到計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、藝術(shù)設(shè)計(jì)等各種學(xué)科領(lǐng)域。筆者在閱讀了國內(nèi)外多篇文獻(xiàn)后將它們的各種理念,方法等總結(jié)如下。
1數(shù)據(jù)的含義 數(shù)據(jù)(Date),是用來描述科學(xué)現(xiàn)象和客觀世界的符號記錄,是構(gòu)成信息和知識的基本單元。數(shù)據(jù)是沒有進(jìn)行加工處理的事實(shí),也就是說單個(gè)數(shù)據(jù)之間互不相關(guān),獨(dú)立存在,人們用一定的方式將其排列或表達(dá)就使之間有了意義,供專業(yè)人員進(jìn)行交流、描述、解讀。
大數(shù)據(jù)是具有4個(gè)特點(diǎn)的數(shù)據(jù)——數(shù)據(jù)量大(Volume)、變化速度快(Velocity)、數(shù)據(jù)類型多樣化(Variety)與價(jià)值密度低(Value)。從計(jì)算機(jī)技術(shù)的角度說,大數(shù)據(jù)是結(jié)構(gòu)復(fù)雜、數(shù)量龐大、類型眾多的數(shù)據(jù)集合。通俗來說,大數(shù)據(jù)就是海量資料。在效率至上的時(shí)代,其規(guī)模巨大而人工無法在較短的時(shí)間內(nèi)采集、管理、處理、分析并整理出通俗易懂的內(nèi)容。從而又孕育出大數(shù)據(jù)技術(shù)——處理、管理等大數(shù)據(jù)技術(shù)。
可視化,不僅僅是可以看見,更多的是指易于理解。是把復(fù)雜的、不直觀的、不清晰、難于理解的事物變得通俗易懂,一目了然。以便于傳播、交流和溝通,以及進(jìn)一步的研究??梢暬幌抻谝曈X層面,除了結(jié)合國標(biāo)、文字、表格、錄像等形式、也可以結(jié)合聽覺、嗅覺、觸覺等感覺,并加入交互處理的技術(shù),理論和方法,讓用戶易于理解。可視化注重視覺表達(dá)、交互方式和人類的心理感知,通過對心理學(xué)、圖形設(shè)計(jì)等知識等合理運(yùn)用來展現(xiàn)數(shù)據(jù)并有效傳達(dá)其隱含意義。
2國內(nèi)外研究現(xiàn)狀
縱觀最近幾年的國內(nèi)外大部分?jǐn)?shù)據(jù)可視化的著作和論文資料,可視化在學(xué)術(shù)界的優(yōu)秀成果,可以涵蓋城市數(shù)據(jù)可視化科學(xué)可視化、圖可視化、高維數(shù)據(jù)可視化、人機(jī)交互(HCI)、AR/VR、數(shù)據(jù)敘事、可視分析等多個(gè)方面。
數(shù)據(jù)可視化是從Date Visualization翻譯而來。從Ben Fry的著作《可視化數(shù)據(jù)》,Nathan Yau的著作《鮮活的數(shù)據(jù)——數(shù)據(jù)可視化指南,Julie Steele和Noah lliinsky的著作《數(shù)據(jù)可視化之美》和Tufte、Few、cCandless等作家的可視化入門書籍中可以得到,如何發(fā)現(xiàn)問題、數(shù)據(jù)收集、可視化的分類和步驟、可視化工具的選取和應(yīng)用技巧方面來對數(shù)據(jù)可視化技術(shù)的實(shí)際操作進(jìn)行指導(dǎo)。國內(nèi)的很多資料也都是從國外的網(wǎng)站、文獻(xiàn)翻譯而來的。含金量較高的學(xué)術(shù)論文往往是提出最新的高效算法和對其他相關(guān)技術(shù)的研發(fā)。在具體的可視化實(shí)現(xiàn)方面,在各個(gè)領(lǐng)域包括傳統(tǒng)的醫(yī)學(xué)、天文學(xué)等,新興的社會媒體、人機(jī)交互、ARNR等領(lǐng)域,國內(nèi)外都研究在逐步地深入研究。
隨著時(shí)代與技術(shù)等發(fā)展,可視化是一個(gè)高度綜合的交叉型領(lǐng)域,深度和廣度都在不斷的擴(kuò)展。大量的研究專注于搜集和分析過去和現(xiàn)在的事件,研究如何利用現(xiàn)在科技更好的展示數(shù)據(jù),優(yōu)化人機(jī)的互動,較少有利用這些信息,來尋找未來可能發(fā)生的事情。除了讓用戶獲取已有的信息,幫助用戶及時(shí)發(fā)現(xiàn)之后發(fā)生的事情,對未來事件的識別和描述,讓用戶未雨綢繆,及時(shí)準(zhǔn)備,應(yīng)該是一個(gè)新的研究方向。
從最近的幾場可視化研討會上,我們可以了解到可視化前沿技術(shù)的發(fā)展?fàn)顩r,了解現(xiàn)在研究者的各種看法與觀點(diǎn)?,F(xiàn)在的研究內(nèi)容,可以包括大規(guī)??茖W(xué)數(shù)據(jù)可視化、城市數(shù)據(jù)可視化、靈活構(gòu)建可視化、新聞數(shù)據(jù)可視化、生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)可視分析、文化遺產(chǎn)應(yīng)用數(shù)據(jù)可視化、理解和診斷深度學(xué)習(xí)模型等多種方向。
3呈現(xiàn)方式
可視化除了傳統(tǒng)的桌面呈現(xiàn)方式之外,近年來,學(xué)術(shù)界又提出了多層次的可視化、富交互多角度探索,以及通過故事敘事的形式表現(xiàn)分析目標(biāo)。
多維度可以表現(xiàn)在解釋數(shù)據(jù)關(guān)聯(lián)趨勢的多種手段,而這些手段可以是地圖、圖表、圖像、動畫、標(biāo)簽云等。運(yùn)用這些手段可以使可視化的過程更加直觀化、關(guān)聯(lián)化、藝術(shù)化,增加了用戶與數(shù)據(jù)之間等交互性?,F(xiàn)在,多變量可視化的研究,大量是平行坐標(biāo),散點(diǎn)圖矩陣。研究同時(shí)還會伴隨時(shí)空或?qū)哟蔚男畔?,表現(xiàn)這些層次上還需要努力。
富交互多角度方面,用戶不僅可以在數(shù)據(jù)可視化平臺上更加容易的理解數(shù)據(jù)所傳達(dá)的信息,用戶也成為改進(jìn)優(yōu)化的一種因素。了解數(shù)據(jù)可視化的人群不只限于數(shù)據(jù)可視化的用戶,還有相當(dāng)多的關(guān)注結(jié)果的觀眾。用戶既是數(shù)據(jù)的提高者也是優(yōu)化結(jié)果的觀眾。
隨著技術(shù)的發(fā)展,交互技術(shù)和新的展示方式的發(fā)展,數(shù)據(jù)可視化已經(jīng)不再局限在平面或桌面上。AR、VR領(lǐng)域的研究飛速發(fā)展,越來越多的可穿戴設(shè)備讓人們可以身臨其境的感受數(shù)據(jù),深入理解數(shù)據(jù)。由此,也有一些研究人員開始研究更多自由度的交互和沉浸式的表現(xiàn)。
通過故事敘事的形式表現(xiàn)分析目標(biāo),將數(shù)據(jù)轉(zhuǎn)化為視覺共享的故事。在可視化數(shù)據(jù)故事和一般數(shù)據(jù)可視化之間繪制一條線,縮小視覺數(shù)據(jù)故事的范圍,從而促進(jìn)通過數(shù)據(jù)可視化的講故事講解技巧進(jìn)行更好的結(jié)構(gòu)化討論??紤]到將數(shù)據(jù)轉(zhuǎn)換為視覺共享的故事以及更加集中的定義的整個(gè)過程,我們認(rèn)為可以擴(kuò)大視覺數(shù)據(jù)故事的研究范圍。通過在視覺數(shù)據(jù)講故事過程中追求這些新的研究途徑,可視化可以使數(shù)據(jù)更加有效的講故事。故事除了前面提到的線性敘述,更多的是非線性的敘述。是跳出時(shí)間先后順序的敘事技巧。這種技巧多運(yùn)用在文學(xué)、戲劇、電影、小說和電子游戲中。設(shè)計(jì)師需要多去研究交叉學(xué)科的知識。
動態(tài)圖可視化,就是動態(tài)展現(xiàn)信息的圖表,用戶能與之交互的圖表。用戶用手點(diǎn)一點(diǎn),就可以看到自己想要了解的數(shù)據(jù),并用動畫的方式呈現(xiàn)出來。這樣的圖表,前期需要整理數(shù)據(jù)之間的相互關(guān)系程度,邏輯思想,現(xiàn)在有的分析方法可以分為small multiples和animation兩類,當(dāng)然還有其他的方式。實(shí)現(xiàn)震撼人心的視覺效果,也有不少工具可以使用——Processing,Ocam,Adobe premiere,Adobe effecto