曾瀟瀟
(華中科技大學,武漢 430070)
在人類所有的感官中,視覺被認為是一種主要的、強大的輸入通道。它吸收了我們周圍的一切事物,并將這些信息傳遞給大腦,以便對它的含義進行即時分析。在視覺與認知的密切聯(lián)系下,學習和創(chuàng)造視覺設(shè)計的第一步是通過理解人類視覺感知的工作方式。視覺感知是相對的,不斷地掃描,不斷調(diào)整焦點,不斷適應(yīng)。我們的視覺將信息傳遞給我們的大腦,我們的大腦負責處理所看到的信息,人類的視覺和認知進行特定的相互作用。更重要的是,人類視覺的復雜和神秘的本質(zhì),它為視覺設(shè)計師創(chuàng)造了大量的機會來利用人類的視覺感知,因為它與信息可視化有關(guān)。在所有獨特的視覺特征中,兩種感知特性在信息可視化中被普遍應(yīng)用:前意識的處理和格式塔法。
在感官記憶中進行的前意識的視覺處理,是創(chuàng)建視覺表征的基礎(chǔ)。在沒有意識干預(yù)的情況下,觀眾可以瞬間感知到前意識關(guān)注的視覺屬性。信息可視化研究的關(guān)鍵問題之一是研究人類視覺系統(tǒng)如何處理和分析圖像,這項研究的一個重要的初步結(jié)果是,少量的視覺特性可以被“低級”視覺系統(tǒng)快速而準確地檢測出來。這些特性被稱為“前意識”,因為它們的檢測似乎是在集中注意力之前。要充分認識到這一觀點的價值可能是困難的,但理解前意識的處理對于可視化設(shè)計是很重要的。特別是,通過開發(fā)前意識的處理能力,可以回答幾個重要的設(shè)計問題,例如,可以立即感知到什么?哪些視覺特性是好的鑒別器?是什么誤導觀眾呢?怎樣才能設(shè)計出這樣引人注意的信息?
來自北卡羅來納州立大學的Christopher G. Healey創(chuàng)建了一個網(wǎng)站,以展示關(guān)于信息可視化體驗的前意識處理方法。圖1中給出了他的一個例子:該圖顯示了如何根據(jù)顏色差異搜索目標圓——在所有較亮圓圈中較暗的圓會凸顯出來。這是前意識處理的基礎(chǔ)卻普遍使用的用法。前意識設(shè)計中也會使用其他一些基本工具包括長度,寬度和強度,還有更高級的符號,包括照明和運動方向。
格式塔組織法則也被稱完形法則,描述如何在圖形顯示中安排視覺符號,以優(yōu)化圖像達到一個更好、更有效的可視化效果。這些法則關(guān)注的是人們?nèi)绾谓庾x世界,提供有關(guān)知覺組織的相關(guān)原則。格式塔法最早是由德國心理學家在20世紀初提出的,它們的主要目的是幫助理解感知模式,同時也提供對許多基本感知現(xiàn)象的清晰描述。心理學家稱他們?yōu)榉▌t,這些原則更像是啟發(fā)式,是解決問題的思維捷徑。
> 圖1 Christopher G. Healey運用顏色差異搜索目標
> 圖2 Chernoff Faces
> 圖3 用平行坐標表示汽車變量的關(guān)系
一個著名的格式塔定律被稱為“花瓶”圖,這幅圖畫出了圖形組織和邊緣分配的關(guān)鍵要素,以及它對形狀感知的影響。人們可以注意到,在花瓶畫中,感知到的形狀取決于被分配的黑白區(qū)域的邊界。與其相反,物的認知可以被認為是識別物體的基本知覺行為的一部分。必須承認格式塔法在信息可視化中起著重要的作用。這些法則適用于圖形的創(chuàng)建以避免其相互干擾。具體來說,根據(jù)格式塔法則,可視化設(shè)計應(yīng)該避免不加標記,使用感知有效的編碼,而不是分散觀眾的注意力。用真實的信息創(chuàng)建有效和富有表現(xiàn)力的視覺設(shè)計是信息可視化的重中之重。
在信息可視化的一個定義中,有必要說明“使用計算機支持的交互式數(shù)據(jù)可視化來放大認知”強調(diào)信息可視化與人類認知的緊密聯(lián)系。圖形的一個顯著優(yōu)點是通過人類視覺幫助簡化任務(wù)完成所需要的信息。尤其是為了使知識具體化,僅當數(shù)據(jù)無法輕易提供信息時,使用信息可視化可以提供幫助。視覺輔助的認知是由于它增加了記憶和資源的處理,通過前意識的屬性、格式塔定律,和許多其他的知覺屬性。通過簡化對信息的搜索并增強對模式的識別,可視化可以實現(xiàn)感知推理操作。
Edward Tufte愛德華·塔夫特是《紐約時報》的“數(shù)據(jù)達芬奇”(The da Vinci of data)的作者,他用簡潔的文字和巧妙的插圖書籍顯示了數(shù)據(jù)的視覺效果。除了在信息設(shè)計方面的著述,Tufte也是該領(lǐng)域的先鋒。通過他的作品,他提出了視覺化設(shè)計的關(guān)鍵原則,為展示信息提供了實質(zhì)性的和重要的見解,以達到最大的效果。
Tufte的原則的一個后果是通過信息可視化實現(xiàn)卓越的圖形化能力。根據(jù)Tufte的說法,圖形化的卓越是“精心設(shè)計的有趣數(shù)據(jù)的展示——實質(zhì)、統(tǒng)計和設(shè)計的問題?!敝纼?yōu)秀的圖形是由復雜的想法(圖中沒有歧義或混亂)、精確性(真實的結(jié)果和不失真的演示)和效率(極少量的圖表“垃圾”)組成的,這是一個關(guān)鍵的問題。卓越的圖形能力將使觀眾在最短的時間內(nèi)獲得最多的創(chuàng)意,并且在最小的空間內(nèi)使用最少的筆墨。這樣的圖形化的優(yōu)秀通過兩個目標來實現(xiàn):(1)通過圖形完整性原則來說明數(shù)據(jù)的真實性;(2)通過設(shè)計原則實現(xiàn)的清晰和精確的可視化。
圖形完整性原則涉及具有清晰,詳細和徹底的標簽,可用于防止圖形失真和模糊。Tufte還將“謊言因素”定義為“描述圖形中顯示的效果大小與數(shù)據(jù)中顯示的效果大小之間關(guān)系的值”。具體地說,數(shù)字的表示,就像在圖形本身表面上測量的那樣,應(yīng)該與所代表的數(shù)量成正比。Tufte介紹的另一個設(shè)計原則是“數(shù)據(jù)墨水比”。Tufte將數(shù)據(jù)墨水稱為“非可擦的圖形核心”,非冗余墨水是為了響應(yīng)數(shù)字的變化而排列的。從定義上說,非數(shù)據(jù)墨水是不傳遞信息的墨水,而是用于衡量尺度、標簽和邊緣。為了進一步擴展,數(shù)據(jù)墨水比率是“用于提供實際數(shù)據(jù)的墨水比例,與整個顯示器使用的像素總量相比?!彼羞@些細節(jié)和目標的教訓是,好的圖形應(yīng)該只包括數(shù)據(jù)墨水;應(yīng)盡可能刪除所有非數(shù)據(jù)墨水,以避免在演示文稿中引起注意力分散、無關(guān)的內(nèi)容。其目標是設(shè)計一個具有最大可能的數(shù)據(jù)——墨水比率的顯示器,而不會消除有效通信所必需的內(nèi)容。
非數(shù)據(jù)墨水的概念也導致了避免“圖表垃圾”的討論。圖表垃圾是圖表和圖表中的所有視覺元素,對于觀看者來說,沒有必要去理解圖表上的信息,或者轉(zhuǎn)移觀眾對這些信息的注意力。不需要的元素的例子包括重的或暗的網(wǎng)格線,不必要的文本,或不適當?shù)膹碗s字體。有趣的是,有研究表明人們接受這種“極簡主義”的信息可視化方法。與Tufte所寫的不一致的研究表明,在某些情況下,圖表垃圾被認為是有用和有效的。這些信息可視化學者認為,精化并非都是壞事,視覺修飾可能還有其他好處。特別是當使用圖的目的是說服或演示時,它們應(yīng)該被設(shè)計成幫助提供數(shù)據(jù)的可記憶性的特定目標。通過對現(xiàn)有研究的評價,支持數(shù)據(jù)圖形必須引起讀者的興趣,這是通過使用圖形圖像來實現(xiàn)的。
當涉及到信息可視化時,有很多技術(shù)可以被利用。這些技術(shù)包括簡單的圖表,如條形圖和線形圖,以及更高級的技術(shù),如熱圖和散點圖矩陣。有些技術(shù)是為特定目的而創(chuàng)建的,因此很難對它們進行分類。在本節(jié)中,主要重點將介紹幾種常用的信息技術(shù)。
讓我們從定義多變量數(shù)據(jù)開始,因為它是許多技術(shù)中常用的術(shù)語和概念。多變量數(shù)據(jù)指的是三維以上的數(shù)據(jù)。換句話說,在數(shù)據(jù)集中每個案例中有三個以上的變量。
可視化多變量數(shù)據(jù)的第一種方法是通過多個視圖。使用這種技術(shù),如果一個人不能在一個圖中顯示所有的維度數(shù)據(jù),你可以嘗試在多個圖形中顯示它們,每個圖形都傳遞一個特定的信息。思想的邏輯進展是確定一種更直觀的方式,使每個變量都有自己的顯示,每個變量得到一個圖并顯示在對應(yīng)的軸上,將多變量數(shù)據(jù)表示劃分為數(shù)個子圖,子圖再將數(shù)據(jù)映射到二維平面上。雖然這種可視化技術(shù)易于實現(xiàn)和直觀,但存在一個直接的缺點:隨著變量數(shù)量的增加,每個變量所需的子圖的數(shù)量也會增加。這增加了一次有太多子圖的風險,這增加了影響判斷的因素,使信息的理解和處理具有挑戰(zhàn)性。
一種更復雜的可視化多變量數(shù)據(jù)的方法是使用散點圖矩陣。散點圖矩陣是可視化設(shè)計人員所鐘愛的圖形工具之一。散點圖會呈現(xiàn)一個視覺顯示,以捕獲一對變量之間的相關(guān)性。給定一組n個變量,有n個選擇2對變量,因此有相同數(shù)量的散點圖。這些散點圖可以被組織成一個矩陣,使得在一個地方可以很容易地表示和觀察所有的成對關(guān)聯(lián)。
另一種有趣的視覺形象被稱為Chernoff Faces。赫爾曼·切爾諾夫是一位應(yīng)用數(shù)學家、統(tǒng)計學家、物理學家和教育家,他發(fā)明了切爾諾夫臉譜,用人臉的形狀來顯示多變量數(shù)據(jù)。Chernoff在美國統(tǒng)計學會雜志上發(fā)表的論文中他建議簡化,卡通形式的面孔形狀能夠代表數(shù)據(jù)集中的許多變量。如圖2通過映射數(shù)字頭偏心,眉形、眼大小,眼睛偏心率、瞳孔大小,鼻子大小,鼻子寬口曲率、口寬度,和嘴開放,能夠達到視覺理解。Chernoff的臉譜幫助觀眾更快更準確地檢測出模式、分組和相關(guān)性。這一理論建立在這樣一個事實基礎(chǔ)之上:人類的大腦有能力識別面部特征的細微差異,同時也能同時吸收許多面部特征。
當數(shù)據(jù)集由純分類數(shù)據(jù)組成時,就會使用一種流行的可視化工具——馬賽克圖。鑲嵌圖讓分析師可以檢驗兩個或更多的分類變量之間的關(guān)系。馬賽克圖以長度為1的正方形開始,然后根據(jù)與第一個分類變量相關(guān)聯(lián)的概率的比例水平劃分。然后,每個水平的橫條根據(jù)第二個分類變量的條件概率的比例,在垂直方向上進一步分裂??梢允褂玫谌偷谒膫€變量,等等。
類似馬賽克圖的可視化技術(shù)是treemap。Treemaps是理想的情況,在這種情況下,需要可視化大量的樹結(jié)構(gòu)(或?qū)哟谓Y(jié)構(gòu))數(shù)據(jù)。treemap的空間首先被分割成矩形,這些矩形的大小和順序都是基于一個數(shù)量變量。通過可視化嵌套的矩形來捕獲treemap的層次結(jié)構(gòu)。例如,代表一個國家的矩形可能包含代表該國的多個矩形。表示狀態(tài)的每個矩形依次包含代表這些狀態(tài)中的城市的矩形。可以使用許多不同的算法來確定treemap中矩形的大小和順序,并考慮到treemapping的一般規(guī)則。一般來說,在treemap中,矩形的大小是:最大的矩形將被放置在左上角,最小的矩形將被放置在右下角,中間的所有東西都放在treemap的中間部分。當矩形被嵌套時,層次結(jié)構(gòu)被呈現(xiàn)。
另一個被廣泛采用和有用的可視化技術(shù)是平行坐標。平行坐標是最著名的可視化技術(shù)之一,也是最常見的可視化學術(shù)論文主題之一。雖然一個人對平行坐標的最初印象可能是令人困惑的,一旦他們理解了,就很容易理解為什么他們是理解多維數(shù)字數(shù)據(jù)集的強大工具。如何通過一個例子更好地解釋平行坐標的作用。圖3顯示了一個平行坐標的例子,其中包含了汽車變量的關(guān)系,包括每加侖(MPG)里程、氣缸數(shù)、馬力、重量,以及它們被引入的年份。在這個可視化中,每個汽車變量都被映射到一個垂直軸上。因此,每一個數(shù)據(jù)值都在直線上的某個位置上,并被縮放到位于底部的最小值和頂部的最大值之間。對于行中的每一個情況,數(shù)據(jù)點都是連通的,并構(gòu)成折線。可以從這個可視化中獲得有用的見解。例如,圓筒軸是值得注意的,因為它只有幾個不同的值。由于柱體的數(shù)量只能是一個整數(shù),在這個例子中只有8個值,所以所有的線都要經(jīng)過一小部分點。在MPG和氣缸之間的空間中,可以看出,八缸汽車的里程一般比六缸和四缸汽缸低。
線條的“外觀”即它們?nèi)绾谓徊嬉约叭绾握郫B,可以說明的不僅僅是數(shù)據(jù)。例如,線路的過度交叉是反向關(guān)系的指標;例如,汽缸越多,里程越低。在氣缸和馬力之間也可以發(fā)現(xiàn)類似的相關(guān)性:氣缸越多,馬力越大。還有一些交叉線表明,更多的汽缸并不總是意味著更多的權(quán)力;然而,總體趨勢顯然存在。 在馬力和重量之間,情況是相似的:更大的馬力意味著總體上更重的汽車,但是在價值上存在一些差異。 人們也可以看到,只有一個很輕的高馬力八缸汽車是個例外。最后,重量和年份之間的界線十分交叉,這意味著多年來汽車變得更輕。
經(jīng)過幾十年的信息可視化的快速變化,創(chuàng)造引人注目、視覺刺激的內(nèi)容的能力比以往任何時候都要大。通過專門的努力,研究人員、學者和實踐者已經(jīng)開發(fā)出可視化的理論、技術(shù)、軟件工具和應(yīng)用程序,它們可以用于各種各樣的目的,并且可以以一種引人注目的方式面向目標受眾。為了最大限度地利用這些發(fā)現(xiàn)和技術(shù),可視化學習者要思想開放,不斷地尋找新的知識和技能,同時跟上潮流和變化這是很重要的?!?/p>