信 睿,艾廷華,何亞坤
武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079
Gosper地圖的非空間層次數(shù)據(jù)隱喻表達(dá)與分析
信 睿,艾廷華,何亞坤
武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079
本文借助隱喻地圖的思想,研究非空間層次數(shù)據(jù)的空間隱喻表達(dá)與分析,以地圖視角對(duì)非空間數(shù)據(jù)進(jìn)行空間化處理,將抽象數(shù)據(jù)具象化以降低認(rèn)知負(fù)荷,對(duì)地圖學(xué)相關(guān)方法進(jìn)行綜合運(yùn)用以拓寬其應(yīng)用外沿。結(jié)合制圖學(xué)經(jīng)典方法開(kāi)展地圖視覺(jué)設(shè)計(jì),以自然地貌隱喻數(shù)據(jù)特征,針對(duì)層次數(shù)據(jù)結(jié)構(gòu)特點(diǎn),將LOD及Cartogram技術(shù)引入隱喻地圖的表達(dá)分析中,對(duì)各層級(jí)數(shù)據(jù)特征進(jìn)行有效凸顯,達(dá)到通過(guò)地圖研究其背后數(shù)據(jù)規(guī)律特征之目的。最后,將本研究提出的方法應(yīng)用于真實(shí)文件層次數(shù)據(jù),進(jìn)行文件數(shù)量分布、大文件群落定位、文件縱深分析等試驗(yàn)。結(jié)果表明,本研究能夠有效表達(dá)層次數(shù)據(jù),并支持一定的地圖分析及數(shù)據(jù)挖掘工作。
隱喻地圖;非空間數(shù)據(jù);層次數(shù)據(jù);Gosper地圖;地圖表達(dá);地圖分析
大數(shù)據(jù)時(shí)代,如何從海量數(shù)據(jù)中挖掘有效信息以發(fā)現(xiàn)深層規(guī)律成為各領(lǐng)域?qū)W者關(guān)注和研究的熱點(diǎn)問(wèn)題。數(shù)據(jù)的抽象性與巨量性一道,阻礙著人類(lèi)對(duì)其認(rèn)知理解,需要相關(guān)技術(shù)方法滿足直觀、概覽的需求??梢暬癁榇颂峁┝丝煽康慕鉀Q方案,但選擇何種可視化方式促進(jìn)認(rèn)知是亟待解決的問(wèn)題。大數(shù)據(jù)中存在大量以文本的方式描述事物構(gòu)成、性質(zhì)、類(lèi)型等本體特征的非空間數(shù)據(jù),層次數(shù)據(jù)即是其中一類(lèi)。過(guò)去,通常使用多叉樹(shù)、TreeMap[1]等可視化方式表達(dá)層次數(shù)據(jù)。然而,多叉樹(shù)中上下方位及邊連接所提供的視覺(jué)線索難以直觀反映包含關(guān)系,同時(shí)要素屬性很難在多叉樹(shù)中得到合理表達(dá)[2],其較低的空間利用率也是不容忽視的問(wèn)題[3]。TreeMap克服了上述缺陷,但其進(jìn)行空間剖分時(shí)視覺(jué)感生硬,缺乏美感及藝術(shù)性。文獻(xiàn)[4]總結(jié)了層次數(shù)據(jù)可視化的相關(guān)因素,基本概括了層次數(shù)據(jù)的各種表達(dá)形式,但筆者認(rèn)為其主要存在以下不足:①未對(duì)視覺(jué)變量進(jìn)行有效利用;②忽略了空間位置的重要意義;③表達(dá)過(guò)于抽象,未能充分調(diào)動(dòng)人的認(rèn)知天賦,往往專(zhuān)業(yè)人士才能理解。
人類(lèi)的生活離不開(kāi)與空間的交互,在此過(guò)程中不斷培養(yǎng)視覺(jué)熟悉與空間思維,空間形象思維促進(jìn)了人對(duì)事物的認(rèn)知理解。從紙質(zhì)地圖到電子導(dǎo)航地圖,再到虛擬現(xiàn)實(shí)技術(shù),皆在借助人類(lèi)空間思維高效地完成信息的傳遞任務(wù)。隨著信息公開(kāi)化的日益深入,大量無(wú)定位特征的純語(yǔ)義數(shù)據(jù)不斷涌現(xiàn),許多專(zhuān)家學(xué)者希望借助人類(lèi)的空間思維,使用空間語(yǔ)言表達(dá)此類(lèi)抽象數(shù)據(jù),以降低認(rèn)知負(fù)荷,空間化思想應(yīng)運(yùn)而生。空間化是針對(duì)不具備空間屬性的數(shù)據(jù),完成從高維抽象空間至低維可視空間的系統(tǒng)轉(zhuǎn)換,利用人類(lèi)潛在經(jīng)驗(yàn),以空間事物的形式促進(jìn)數(shù)據(jù)的表達(dá)與挖掘[5-6]。文獻(xiàn)[7]闡述了空間化的框架并介紹其應(yīng)用,在語(yǔ)義數(shù)據(jù)挖掘方面,文獻(xiàn)[8]較早借助空間化思想表達(dá)文本數(shù)據(jù)。地圖是展示空間信息的常用工具,其亦可作為非空間數(shù)據(jù)的表達(dá)載體,即隱喻地圖,隱喻地圖是通過(guò)構(gòu)造虛擬地圖空間,以地圖要素展示語(yǔ)義信息的可視化表達(dá)手段[9]。作為空間化的一種形式,隱喻地圖通過(guò)將陌生領(lǐng)域的抽象非定位數(shù)據(jù)表達(dá)為大眾熟悉的地圖對(duì)象,從而建立源目標(biāo)(地圖對(duì)象)與對(duì)象目標(biāo)(表達(dá)對(duì)象)間的映射聯(lián)系,達(dá)到以熟悉、可感的形式展示陌生、抽象內(nèi)容之目的。例如,Aureka軟件[10]以地形圖形式對(duì)專(zhuān)利信息進(jìn)行梳理表達(dá),即“專(zhuān)利地圖”,引發(fā)廣泛關(guān)注,是隱喻地圖領(lǐng)域的經(jīng)典作品。
隱喻地圖對(duì)層次數(shù)據(jù)可視化存在的問(wèn)題給出了相應(yīng)解決方案:傳統(tǒng)地圖學(xué)為可視化表達(dá)提供了經(jīng)典原理與方法,如Bertin視覺(jué)參量理論[11];通過(guò)對(duì)地理學(xué)第一定律的實(shí)現(xiàn),將屬性上相近的要素布設(shè)為地圖上臨近的對(duì)象,賦予空間位置重要含義;千百年來(lái)在制圖識(shí)圖過(guò)程中的經(jīng)驗(yàn)證明,地圖符合人類(lèi)認(rèn)知習(xí)慣,甚至學(xué)齡前兒童也能進(jìn)行地圖閱讀[12]。文獻(xiàn)[13]研究得出空間相關(guān)信息占信息總量的57%,而非傳統(tǒng)認(rèn)為的80%,非空間信息領(lǐng)域的擴(kuò)張并不代表空間思維及方法作用域的縮減,地圖在解決傳統(tǒng)空間問(wèn)題的同時(shí),亦可作用于非空間問(wèn)題的分析。
當(dāng)前隱喻地圖的成果較少,文獻(xiàn)[14]選取會(huì)議摘要數(shù)據(jù),使用自組織映射技術(shù)(SOM)進(jìn)行主題聚類(lèi)生成地圖;還有研究將表達(dá)關(guān)系數(shù)據(jù)的關(guān)聯(lián)圖轉(zhuǎn)換為地圖的形式表達(dá)[15-16];文獻(xiàn)[17]利用六邊形隨機(jī)擴(kuò)散實(shí)現(xiàn)地圖區(qū)域的填充。其中,文獻(xiàn)[15]和文獻(xiàn)[16]的方法僅能作用于網(wǎng)絡(luò)數(shù)據(jù),對(duì)層次數(shù)據(jù)并不適用,文獻(xiàn)[14]中的方法需對(duì)數(shù)據(jù)進(jìn)行聚類(lèi),并不適合本身即有明顯結(jié)構(gòu)特征的層次數(shù)據(jù),文獻(xiàn)[17]中地圖模塊間縫隙過(guò)大,可視化效果較差。文獻(xiàn)[18]提出了Gosper地圖,其利用Gosper空間填充曲線作為引導(dǎo),通過(guò)反空間索引的方式將節(jié)點(diǎn)布設(shè)在正六邊形地圖單位上,基于層次結(jié)構(gòu)自下而上對(duì)子區(qū)域合并構(gòu)造地圖。Gosper地圖很好地顧及了層次數(shù)據(jù)節(jié)點(diǎn)相鄰關(guān)系,空間上的無(wú)縫拼接也帶來(lái)良好的可視效果,可以作為研究層次數(shù)據(jù)的理想框架。但當(dāng)前研究多側(cè)重于其生成技術(shù)等方面的介紹,對(duì)其具體的應(yīng)用研究不足,很少涉及地圖表達(dá)、分析等方面的工作。
本文借助人類(lèi)空間形象思維認(rèn)知優(yōu)勢(shì)及對(duì)地圖的熟悉,利用地圖隱喻思想對(duì)抽象層次數(shù)據(jù)進(jìn)行類(lèi)地圖表達(dá)。基于Gosper地圖進(jìn)行豐富擴(kuò)充,結(jié)合經(jīng)典地圖學(xué)方法設(shè)計(jì)地圖,以典型自然地貌隱喻數(shù)據(jù)特征,在生成地圖上對(duì)多尺度技術(shù)及焦點(diǎn)上下文思想進(jìn)行綜合應(yīng)用,通過(guò)地圖可視化方式窺探抽象數(shù)據(jù)特征、挖掘潛在規(guī)律。與以往將新可視化技術(shù)、方法引入地圖的研究不同,本研究力圖擴(kuò)展地圖應(yīng)用外沿,將地圖學(xué)的經(jīng)典方法應(yīng)用于非空間數(shù)據(jù)的表達(dá)分析,以地圖的視角研究問(wèn)題。
如圖1中結(jié)構(gòu)所示,本節(jié)闡述Gosper地圖的生成原理及特點(diǎn),介紹地圖隱喻的表達(dá)方法,結(jié)合對(duì)多尺度分析、變形地圖等的論述,為綜合運(yùn)用上述理論方法進(jìn)行層次數(shù)據(jù)分析的試驗(yàn)提供理論基礎(chǔ)。
圖1 理論結(jié)構(gòu)圖Fig.1 Theoretical structure diagram
生成Gosper地圖首先需按分形規(guī)則構(gòu)建Gosper曲線(圖2(a)),利用曲線節(jié)點(diǎn)作為發(fā)生元構(gòu)造泰森多邊形,形成蜂窩狀底圖(圖2(b))。依照Gosper曲線引導(dǎo)順序,將層次數(shù)據(jù)葉子節(jié)點(diǎn)排布在曲線節(jié)點(diǎn)對(duì)應(yīng)的正六邊形上。再根據(jù)父子節(jié)點(diǎn)包含關(guān)系,對(duì)下層子節(jié)點(diǎn)區(qū)域融合得到父節(jié)點(diǎn)區(qū)域(如圖3),自下而上重復(fù)此過(guò)程,生成體現(xiàn)層次數(shù)據(jù)嵌套包含關(guān)系的多邊形集合。
圖2 地圖底圖生成Fig.2 Generate the base map
Gosper地圖使用正六邊形作為構(gòu)造地圖的基本單元,具有無(wú)縫拼接、結(jié)構(gòu)穩(wěn)定、易于擴(kuò)展等優(yōu)點(diǎn)。與柵格圖像常用的正四邊形單元相比,正六邊形在鄰域擴(kuò)展時(shí)區(qū)域連續(xù)性更強(qiáng),其相鄰區(qū)域皆是以共享邊為基礎(chǔ)的強(qiáng)連接,而正四邊形相鄰區(qū)域中存在以共享點(diǎn)為基礎(chǔ)的弱連接關(guān)系。在Gosper曲線的引導(dǎo)下,數(shù)據(jù)與地圖間建立起嚴(yán)格映射,層次數(shù)據(jù)節(jié)點(diǎn)的相鄰關(guān)系能得到很好的顧及,層次包含關(guān)系也便于通過(guò)面域嵌套迅速實(shí)現(xiàn)。
較之于類(lèi)似的Hilbert曲線引導(dǎo)下的規(guī)則格網(wǎng)剖分[19](如圖4),Gosper地圖中六邊形集合構(gòu)建的區(qū)域避免了過(guò)于規(guī)整的幾何形態(tài),提升了地圖美感,同時(shí)其邊緣形態(tài)與真實(shí)地圖邊界有極高的相似度,增加了其地圖相似性。
“我也這么認(rèn)為過(guò)。”英格曼站下腳,回過(guò)頭對(duì)閉著的大門(mén)說(shuō),“后來(lái)發(fā)現(xiàn),對(duì)你們來(lái)說(shuō),激怒不激怒,結(jié)果都一樣。”
隱喻表達(dá)中常用具象化、空間化的方法促進(jìn)對(duì)抽象事物的理解[20],如“恩重如山”、“情深似?!贝祟?lèi)表達(dá)方式,皆是借助人對(duì)自然景觀的熟悉印象描摹抽象事物特征。隱喻地圖以地圖為載體表達(dá)抽象數(shù)據(jù),可以借用熟悉的地圖屬性特征反映數(shù)據(jù)特點(diǎn),亦可通過(guò)構(gòu)造地形地貌圖的方式輔助數(shù)據(jù)表達(dá)。使用要素面積表達(dá)數(shù)值大小是抽象數(shù)據(jù)具象化中常用的手段,較之于抽象數(shù)值對(duì)比,對(duì)面積大小的判定更為直觀。區(qū)域面積是地圖的重要屬性,Gosper地圖由正六邊形葉子節(jié)點(diǎn)自下而上融合構(gòu)建,故其節(jié)點(diǎn)區(qū)域面積的大小反映了包含葉子節(jié)點(diǎn)數(shù)目的多寡,可以此實(shí)現(xiàn)通過(guò)有形的區(qū)域面積隱喻抽象的節(jié)點(diǎn)數(shù)目,也為利用面積的橫向?qū)Ρ确治鋈~子節(jié)點(diǎn)的數(shù)量分布提供了便利。通過(guò)構(gòu)建Gosper地圖,各數(shù)據(jù)項(xiàng)都在地圖空間上擁有了對(duì)應(yīng)的位置。對(duì)于需要分析表達(dá)的目標(biāo)屬性,將屬性值轉(zhuǎn)換為相應(yīng)位置的地形數(shù)據(jù)(如高程值),制作虛擬地形,并借鑒經(jīng)典地圖用色,生成地貌暈渲圖。建立自然地貌與抽象數(shù)據(jù)間的聯(lián)系,通過(guò)地貌特點(diǎn)隱喻數(shù)據(jù)特征,如使用較高的地勢(shì)表達(dá)較大的數(shù)值,通過(guò)水深隱喻層次數(shù)據(jù)的縱深等,利用此類(lèi)直觀可感的空間場(chǎng)景調(diào)動(dòng)用戶形象思維,提升其興趣,加深對(duì)數(shù)據(jù)的理解。
研究問(wèn)題的出發(fā)尺度決定了研究結(jié)果的精度,為滿足不同精度需求,需在不同尺度上分析問(wèn)題。地圖中對(duì)尺度的研究十分重視,在早期介紹空間化的文章中也強(qiáng)調(diào)了尺度的應(yīng)用[6]。文獻(xiàn)[21]研究尺度的隱喻作用,結(jié)果表明人可以將空間分辨率的改變同層次的變化相聯(lián)系。在多尺度技術(shù)方面,LOD技術(shù)可視作多粒度、多層次的切片集合,通過(guò)不同的尺度控制,可以對(duì)不同切片進(jìn)行可視化展示[22]。本文將LOD技術(shù)引入隱喻地圖的研究分析,建立地圖切片、LOD級(jí)別、地圖比例尺間對(duì)應(yīng)關(guān)系。結(jié)合不同表達(dá)分析需求,控制展示反映不同層次語(yǔ)義信息的地圖切片,以便在不同尺度上對(duì)數(shù)據(jù)展開(kāi)分析挖掘工作。
圖3 Gosper地圖生成原理Fig.3 The producing principle of Gosper map
圖4 皮亞諾曲線網(wǎng)格剖分結(jié)果Fig.4 The split result of Peano curve
首先,將空間上重合的各地圖面域進(jìn)行分離,按層次為其賦予LOD等級(jí)。如圖5所示,對(duì)于層次樹(shù)上游節(jié)點(diǎn)所對(duì)應(yīng)的區(qū)域,為其設(shè)定較小的LOD等級(jí),隨著層次的深入,展示細(xì)節(jié)信息的子節(jié)點(diǎn)區(qū)域?qū)?yīng)較高的LOD等級(jí)。以上建立了基于LOD等級(jí)的多層次場(chǎng)景集合,LOD級(jí)別的遞增對(duì)應(yīng)著面域剖分的逐層深入,細(xì)節(jié)信息也進(jìn)一步得到展現(xiàn)。同一比例尺下,細(xì)節(jié)信息的增加有時(shí)會(huì)導(dǎo)致圖上符號(hào)密度過(guò)大的問(wèn)題,影響觀察效果,需要通過(guò)變換比例尺進(jìn)行調(diào)節(jié)。比例尺范圍與不同級(jí)別LOD場(chǎng)景的一般對(duì)應(yīng)關(guān)系為:小比例尺范圍下顯示LOD級(jí)別較低的地圖場(chǎng)景,大比例尺下則對(duì)應(yīng)高級(jí)別的LOD地圖場(chǎng)景。在較小的比例尺下,地圖視野范圍較廣,低級(jí)別的LOD地圖表達(dá)較為概略,適合進(jìn)行面向數(shù)據(jù)整體的宏觀性分析,但缺少對(duì)數(shù)據(jù)細(xì)節(jié)方面的展示。隨著分析的深入,疊加LOD級(jí)別較高的地圖場(chǎng)景以展示更多細(xì)節(jié)信息,為鎖定分析目標(biāo),將圖面切換至較大比例尺下對(duì)細(xì)節(jié)內(nèi)容進(jìn)行精確顯示。較之于上一地圖場(chǎng)景,此時(shí)的地圖視野范圍收縮,但表達(dá)的信息更為詳實(shí),適合進(jìn)行微觀的個(gè)體研究。
圖5 Gosper地圖LOD級(jí)別劃分Fig.5 LOD level of Gosper map
隱喻地圖與LOD技術(shù)的結(jié)合,將往常用于地圖空間分析的方法過(guò)程應(yīng)用至抽象數(shù)據(jù)的分析,豐富地圖視角的同時(shí),有效顧及了層次數(shù)據(jù)的結(jié)構(gòu)特征,便于對(duì)其進(jìn)行全方位剖析,粗獷尺度用以研究數(shù)據(jù)宏觀規(guī)律如整體分布、變化趨勢(shì),精細(xì)尺度則利于理解微觀差異。尺度變化提供了由粗至細(xì)研究問(wèn)題的動(dòng)態(tài)視角,順應(yīng)層次數(shù)據(jù)自上而下展開(kāi)的結(jié)構(gòu)。通過(guò)地圖概覽發(fā)現(xiàn)宏觀分布規(guī)律,轉(zhuǎn)換尺度鎖定特征目標(biāo),繼而在微觀尺度下對(duì)目標(biāo)進(jìn)行精細(xì)分析。
在可視化中為顧及主題表達(dá)、特征發(fā)現(xiàn),有些重點(diǎn)內(nèi)容需突出顯示,而另一些內(nèi)容則需弱化,焦點(diǎn)+上下文(focus+context)技術(shù)[23]是常用的表達(dá)手段。焦點(diǎn)+上下文在凸顯局部細(xì)節(jié)的同時(shí)顧及整體上下文信息,使受眾在對(duì)局部特征研究的同時(shí),又不失對(duì)整體的把握,便于特征的快速發(fā)現(xiàn)及分析。本研究通過(guò)Cartogram(即變形地圖)實(shí)現(xiàn)焦點(diǎn)+上下文表達(dá),對(duì)隱喻地圖作變形處理,在保持各區(qū)域相對(duì)位置關(guān)系和拓?fù)浣Y(jié)構(gòu)的基礎(chǔ)上,將對(duì)象屬性信息映射為其面積大小[24]。
變形地圖主要有間斷型、連續(xù)型、球形等多種形式,選擇時(shí)顧及的因素包括拓?fù)溧徑有缘谋3?、?duì)原始形狀的保持、面積對(duì)屬性的反映等幾點(diǎn)[25]。Gosper地圖的生成依靠子節(jié)點(diǎn)區(qū)域自下而上的融合,需要變形后的區(qū)域依然保持無(wú)縫的拓?fù)溧徑樱瑫r(shí),還應(yīng)在視覺(jué)上保證其地圖特征,只有連續(xù)型變形地圖能滿足上述需求。本研究采用基于擴(kuò)散算法[26]的開(kāi)源軟件ScapeToad對(duì)原始幾何數(shù)據(jù)進(jìn)行處理,實(shí)現(xiàn)連續(xù)型變形地圖的構(gòu)建。層次數(shù)據(jù)中各葉子節(jié)點(diǎn)對(duì)應(yīng)的底層區(qū)域是構(gòu)造Gosper地圖的基本單元,對(duì)其進(jìn)行提取后,選擇變形所依據(jù)的屬性值并設(shè)定變形參數(shù)進(jìn)行變形操作,使變形后各要素的面積能反映其屬性值的相對(duì)大小。變形結(jié)果不僅依賴原始數(shù)據(jù)的形態(tài),還與夸張系數(shù)的設(shè)置密切相關(guān),實(shí)際操作中,為獲得理想變形結(jié)果,應(yīng)結(jié)合不同的變形需求設(shè)定相應(yīng)的夸張系數(shù)。變形后的各幾何單元依然遵從原本的鄰接關(guān)系,并且保持無(wú)縫拼接的狀態(tài),借助層次數(shù)據(jù)的歸屬包含關(guān)系,通過(guò)面域融合由子節(jié)點(diǎn)區(qū)域形成父節(jié)點(diǎn)區(qū)域,自下而上地完成其他節(jié)點(diǎn)區(qū)域的變形。變形后的結(jié)果弱化或夸大了某些要素的幾何形態(tài),為受眾提供宏觀上的比對(duì)而非面積的精細(xì)比較,因?yàn)槭鼙娪袝r(shí)并不在意各要素間的細(xì)微差異,而是探尋與眾不同的特征要素,或獲取其分布概覽。
在隱喻地圖上實(shí)現(xiàn)Cartogram技術(shù),使地圖要素表達(dá)抽象對(duì)象的同時(shí),可以對(duì)其屬性信息進(jìn)行有效彰顯突出。通過(guò)地圖載體表達(dá)統(tǒng)計(jì)數(shù)據(jù),將地圖與統(tǒng)計(jì)圖兩者優(yōu)點(diǎn)相結(jié)合,使用有形可感的面積反映抽象數(shù)值屬性,達(dá)到以形象思考代替抽象思考的目的。同時(shí),各要素相對(duì)位置關(guān)系得到有效顧及,便于開(kāi)展特征定位及挖掘等結(jié)合上下文的相關(guān)分析。
計(jì)算機(jī)文件系統(tǒng)屬于典型的層次結(jié)構(gòu)數(shù)據(jù),本節(jié)綜合運(yùn)用上述理論對(duì)其進(jìn)行表達(dá)、分析,試驗(yàn)數(shù)據(jù)為Microsoft Visual Studio 10.0文件夾,共計(jì)22 621個(gè)文件夾和文件。首先通過(guò)遍歷建立文件的層次樹(shù)結(jié)構(gòu),由2.1中的方法將層次樹(shù)轉(zhuǎn)換為層次地圖(圖6),基于層次地圖,進(jìn)行文件數(shù)量分布、大文件群落定位、文件縱深分析等試驗(yàn)。
圖6 層次地圖Fig.6 Level map
作為文件系統(tǒng)的最小組成單元,文件與地圖上的正六邊形構(gòu)建單元相對(duì)應(yīng),節(jié)點(diǎn)區(qū)域面積反映了對(duì)應(yīng)文件夾包含的文件數(shù)量。LOD級(jí)別的遞增對(duì)應(yīng)地圖上邊界分割的不斷細(xì)化,代表各級(jí)文件逐層展開(kāi)(圖7),通過(guò)運(yùn)用LOD技術(shù),可以在不同層次的文件夾中開(kāi)展文件數(shù)量分布的研究。
圖7 文件樹(shù)與層次地圖的層次對(duì)應(yīng)關(guān)系Fig.7 The corresponding relation of document tree and level map
如對(duì)圖8中IDE區(qū)域與VCWizards區(qū)域進(jìn)行面積比對(duì),易知前者所對(duì)應(yīng)的節(jié)點(diǎn)明顯擁有更多葉子節(jié)點(diǎn),即VCWizards文件夾內(nèi)擁有更多的文件。相比Windows操作系統(tǒng)中右鍵查詢屬性的方式,目視判讀更為簡(jiǎn)單直觀。較之于單個(gè)文件作抽象數(shù)字間的對(duì)比,面積的橫向?qū)Ρ忍峁┝艘环N形象可感的方式,使受眾能以全局視角觀察文件數(shù)量的分布,實(shí)現(xiàn)系統(tǒng)中難以操作的同層次文件跨節(jié)點(diǎn)比對(duì)。
疊加不同級(jí)別的LOD地圖場(chǎng)景,在各尺度下進(jìn)行節(jié)點(diǎn)面積橫向比對(duì)。發(fā)現(xiàn)較小LOD級(jí)別地圖中的區(qū)域面積分布極度不均衡,這意味著各淺層文件夾中文件數(shù)量的失衡,具體表現(xiàn)為,文件數(shù)量分布大體遵從帕累托法則,少數(shù)幾個(gè)文件夾占據(jù)大量的文件數(shù)量份額,如圖8中IDE區(qū)域占據(jù)了圖上近一半的面積,與其他區(qū)域呈現(xiàn)鮮明對(duì)比。隨著地圖LOD級(jí)別的增加,圖上疆域不斷被細(xì)分,此種現(xiàn)象逐漸減弱,直至地圖完全被分割為正六邊形集合。
圖8 地圖疆域表達(dá)與系統(tǒng)文件屬性查詢對(duì)比Fig.8 The contrast of territory metaphor and file attribute query
在系統(tǒng)中以文件屬性查詢的方式難以對(duì)大文件的分布情況進(jìn)行宏觀把握。通過(guò)地貌暈渲圖可以概覽大文件的全局分布,夸張的變形地圖則使具體大文件得以凸顯,將變形地圖與LOD技術(shù)結(jié)合,能從多個(gè)尺度對(duì)大文件或大文件群落進(jìn)行定位分析,完成大文件的全局概覽到具體發(fā)現(xiàn)的動(dòng)態(tài)過(guò)程。
基于文件大小制作地貌暈渲圖,如圖9所示,仿照地貌圖特點(diǎn),大文件區(qū)域呈現(xiàn)紅色高地勢(shì),小文件區(qū)域則用綠色低平地形表達(dá)。疊加第2級(jí)LOD地圖的邊界,發(fā)現(xiàn)高地勢(shì)地形大部分集中于VC區(qū)域,Common7區(qū)域邊緣也有部分中高地勢(shì)分布。VC區(qū)域顯著的高地勢(shì)地形又可分為上下兩部分,上面部分呈現(xiàn)聚集分布,下面部分則為離散分布。
如圖10所示,結(jié)合2.4節(jié)理論,根據(jù)文件所占系統(tǒng)空間對(duì)其幾何形態(tài)進(jìn)行夸張?zhí)幚?,由于各文件間大小差異巨大,直接選擇文件大小作為夸張系數(shù),要素間的面積呈現(xiàn)巨大差異,Microsoft Visual Studio 10.0文件夾中幾個(gè)超大型文件得以在圖中被直觀反映出來(lái)。
但上述方法過(guò)渡擠壓了上下文要素,模糊層次隸屬關(guān)系,在需要結(jié)合上下文環(huán)境或?qū)哟侮P(guān)系進(jìn)行的分析中并不適用。此處取文件大小的Log值作為夸張系數(shù),得到結(jié)果如圖11(b)。幾何形態(tài)因子的加入,與顏色一道顯著提高了文件大小的辨識(shí)度,強(qiáng)化了區(qū)分效果。如圖11所示,較之于(a)和(b)、(c)更能對(duì)大文件群落進(jìn)行有效的凸顯,以下基于變形后的文件地圖進(jìn)行多尺度定位分析。
對(duì)第2層級(jí)的文件地圖進(jìn)行整體分析(圖12(a)),易知大文件群落主要分布在Microsoft Visual Studio 10.0的VC文件夾中,Common7中較大的幾個(gè)文件群落也被凸顯出來(lái),與之前使用地貌暈渲圖所得的宏觀結(jié)論一致。將目標(biāo)鎖定于VC中的大文件群落,變化尺度到達(dá)下一層級(jí)文件夾,地圖被更細(xì)化的邊界分割(圖12(b)),大文件群被劃分為上下兩部分,分別位于VC文件夾下的atlmfc和lib文件夾中,在lib中明顯偏紅的色調(diào)意味著其包含了眾多大型文件,其內(nèi)部呈星斑離散分布的態(tài)勢(shì)也印證了地貌暈渲圖中得到的宏觀結(jié)論。
進(jìn)一步變化尺度,通過(guò)地圖放大將視角聚焦在兩個(gè)大文件群(圖13),上方的大文件群被完全包含在lib文件夾中,其內(nèi)部大文件高度聚集的狀態(tài)也與地貌暈渲圖中所得結(jié)論一致。而下方的大文件群落則被幾個(gè)文件夾共同分割,還有一部分已到達(dá)此分支的底層,成為代表文件的六邊形單位。
尺度持續(xù)變化,地圖不斷被分割的更為精細(xì),如圖14所示,當(dāng)目標(biāo)區(qū)域最終呈現(xiàn)為單個(gè)文件區(qū)域集合時(shí),即可得到大文件精確的位置及名稱信息,與圖10中得到凸顯的大文件一致。地圖為大文件的定位搜索提供了概覽直觀的圖形化描述,LOD與Cartogram技術(shù)的結(jié)合,使各層級(jí)文件特征得到有效凸顯,便于在多個(gè)尺度上定位大文件群落,促進(jìn)了大文件的歸屬關(guān)系判別及精確發(fā)現(xiàn)。
文件對(duì)應(yīng)節(jié)點(diǎn)在層次樹(shù)中的深度即為文件的縱深,可簡(jiǎn)單理解為從最外層文件夾到達(dá)目標(biāo)文件所需點(diǎn)擊次數(shù)。如圖15所示,基于文件的縱深屬性制作虛擬水深圖,以水深隱喻文件的縱深,借鑒海洋地圖樣式,低地勢(shì)的深藍(lán)色區(qū)域?qū)?yīng)文件節(jié)點(diǎn)縱深大,而高地勢(shì)、泛白區(qū)域?qū)?yīng)的文件節(jié)點(diǎn)縱深小。在較低尺度的地圖上,通過(guò)虛擬水深圖可以概覽目標(biāo)文件夾中各文件的縱深分布。從圖上可知縱深較大的文件集中分布于Common7文件夾中,而VC文件夾則包含了大部分淺縱深文件,說(shuō)明從整體上,Common7文件夾比VC文件夾有更復(fù)雜的層次嵌套。
不同的層次樹(shù)其結(jié)構(gòu)往往呈現(xiàn)巨大差異,同一層次樹(shù)各分支的結(jié)構(gòu)也不盡相同,有些分支縱深差異很大,有些則比較均衡。對(duì)于體量巨大的文件層次樹(shù)結(jié)構(gòu)的分析,通過(guò)對(duì)水深圖顏色、地勢(shì)的整體觀察,往往更為直觀。如在圖15中分布在Common7和VC中的兩片大面積的淺藍(lán)色區(qū)域,表征著其內(nèi)部文件節(jié)點(diǎn)深度分布十分均勻,文件間縱深差異不大。從區(qū)域整體深度分布看,Common7區(qū)域整體縱深分布較均勻,無(wú)大范圍的深度傾斜,局部深度分布有差異,類(lèi)似圖16(a)中層次樹(shù)描述的狀態(tài)。VC區(qū)域局部深度分布十分均勻,但上下兩部分整體深度差異明顯,即整體深度呈不對(duì)稱分布,可反映圖16(b)中層次樹(shù)的狀態(tài)。
變化LOD級(jí)別,從多個(gè)尺度觀察文件夾縱深分布情況,發(fā)現(xiàn)層次越淺的文件夾,其內(nèi)部深度呈不均勻分布的可能性越大,隨著層次的深入文件夾內(nèi)的深度分布愈發(fā)均勻。如圖17,在第4層級(jí)的LOD地圖中,紅線標(biāo)注的Deployment、src、AppWiz等文件夾,其內(nèi)部深度基本呈均勻分布。
較之于TreeMap、多叉樹(shù)等當(dāng)前表達(dá)層次數(shù)據(jù)常用的方式,本文借助地圖表達(dá)抽象層次數(shù)據(jù)。地圖面域相互嵌套包含的特點(diǎn)用以反映層次歸屬關(guān)系更為直觀,作為常用的空間數(shù)據(jù)表達(dá)載體,地圖具有認(rèn)知上的便利性,其不規(guī)則的幾何形態(tài)、多樣的色彩表現(xiàn)形式,帶來(lái)藝術(shù)美感的同時(shí),也豐富了數(shù)據(jù)表達(dá)形式。與同樣使用Gosper地圖的研究相比,文獻(xiàn)[18]主要關(guān)注地圖生成技術(shù),簡(jiǎn)單展示數(shù)據(jù)層次結(jié)構(gòu),而本文則側(cè)重地圖表達(dá)分析,如通過(guò)引入地貌隱喻促進(jìn)數(shù)據(jù)的理解,并結(jié)合多尺度分析及變形地圖等方法進(jìn)一步輔助數(shù)據(jù)的分析挖掘工作。通過(guò)探索更多的隱喻地圖表達(dá)形式,并引入相關(guān)地圖分析方法,嘗試將地圖作為一種抽象數(shù)據(jù)分析工具而非單純的數(shù)據(jù)展示平臺(tái)。
本文借助隱喻地圖的思想,對(duì)層次數(shù)據(jù)進(jìn)行可視化表達(dá)及分析研究。主要?jiǎng)?chuàng)新在于:①將Gosper地圖引入文件夾數(shù)據(jù)分析,實(shí)現(xiàn)非空間數(shù)據(jù)的空間化分析;②以地圖空間思維研究非空間數(shù)據(jù),通過(guò)地貌圖、水深圖等具有隱喻色彩的地圖形式將抽象問(wèn)題具象化,降低受眾的認(rèn)知負(fù)荷;③綜合運(yùn)用LOD、Cartogram技術(shù),并將二者有效結(jié)合用于探究特征區(qū)域,發(fā)現(xiàn)隱藏規(guī)律。
圖9 虛擬地貌暈渲圖Fig.9 Virtual topographic map
圖10 變形地圖Fig.10 Deformation map
圖12 第2層級(jí)與第3層級(jí)地圖Fig.12 Level two map and level three map
圖13 第4層級(jí)地圖(概覽及放大后細(xì)節(jié))Fig.13 Level four map (the overview and the details after zooming in)
圖14 由第5層級(jí)變換至第6層級(jí)地圖Fig.14 Transformation from level five to level six map
圖15 虛擬水深圖Fig.15 Virtual submarine map
圖16 層次樹(shù)Fig.16 Hierarchical tree
圖17 第四層級(jí)水深圖Fig.17 Level four submarine map
本研究欲借助人類(lèi)對(duì)空間事物的熟悉,以直觀可感的地圖語(yǔ)言降低受眾對(duì)非空間抽象數(shù)據(jù)的認(rèn)知難度,從而增加潛在受眾數(shù)目。地圖一直是人類(lèi)認(rèn)識(shí)、理解地理空間的常用工具,地圖學(xué)為空間事物的認(rèn)知、空間問(wèn)題的分析提供了一系列有效的理論方法,本研究采用地圖隱喻,為表達(dá)分析抽象數(shù)據(jù)開(kāi)辟了嶄新視角,使地圖領(lǐng)域的技術(shù)方法煥發(fā)新生命力。今后還將探究更多的地圖可視化形式,挖掘地圖表達(dá)、分析非空間數(shù)據(jù)的潛力。
[1] JOHNSON B,SHNEIDERMAN B.Tree-maps:A Space-filling Approach to the Visualization of Hierarchical Information Structures[C]∥Proceedings of 1991 IEEE Conference on Visualization.San Diego,CA:IEEE,1991:284-291.
[2] YANG Muye,BIUK-AGHAI R P.Enhanced Hexagon-Tiling Algorithm for Map-Like Information Visualisation[C]∥Proceedings of the 8th International Symposium on Visual Information Communication and Interaction.Tokyo,AA,Japan:ACM,2015:137-142.
[3] BRULS M,HUIZING K,VAN WIJK J J.Squarified Treemaps[M]∥DE LEEUW W C,VAN LIERE R.Data Visualization 2000.Vienna:Springer,2000:33-42.
[4] SCHULZ H J,HADLAK S,SCHUMANN H.The Design Space of Implicit Hierarchy Visualization:A Survey[J].IEEE Transactions on Visualization and Computer Graphics,2011,17(4):393-411.
[5] SKUPIN A,F(xiàn)ABRIKANT S I.Spatialization[M]∥WILSON JOHN P,F(xiàn)OTHERINGHAM A S.The Handbook of Geographic Information Science.Massachusetts:Blackwell Publishing Ltd,2007.
[6] SKUPIN A,BUTTENFIELD B P.Spatial Metaphors for Visualizing Information Spaces[C]∥Proceedings of ACSM/ASPRS Annual Convention and Exhibition.Seattle,WA:ACSM,1997:116-125.
[7] FABRIKANT S I,SKUPIN A.Cognitively Plausible Information Visualization[C]∥DYKES J,MACEACHREN A M,KRAAK M J.Exploring Geovisualization.Amsterdam:Elsevier,2005.
[8] WISE J A,THOMAS J J,PENNOCK K,et al.Visualizing the Non-visual:Spatial Analysis and Interaction with Information from Text Documents[C]∥Proceedings of 1995 Information Visualization.Atlanta,GA:IEEE,1995:51-58.
[9] 艾廷華.大數(shù)據(jù)驅(qū)動(dòng)下的地圖學(xué)發(fā)展[J].測(cè)繪地理信息,2016,41(2):1-7.
AI Tinghua.Development of Cartography Driven by Big Data[J].Journal of Geomatics,2016,41(2):1-7.
[10] MircoPatent,Aureka.http:∥www.micropatent.com/ (2017-5-15)
[11] BERTIN J.Semiology of Graphics:Diagrams,Networks,Maps[M].BERG W J,Trans.Madison:University of Wisconsin Press,1983.
[12] BLADES M,BLAUT J M,DARVIZEH Z,et al.A Cross-Cultural Study of Young Children’s Mapping Abilities[J].Transactions of the Institute of British Geographers,1998,23(2):269-277.
[13] HAHMANN S,BURGHARDT D.How Much Information Is Geospatially Referenced? Networks and Cognition[J].International Journal of Geographical Information Science,2013,27(6):1171-1189.
[14] SKUPIN A.The World of Geography:Visualizing a Knowledge Domain with Cartographic Means[J].Proceedings of the National Academy of Sciences of the United States of America,2004,101(S1):5274-5278.
[15] MASHIMA D,KOBOUROV S,HU Yifan.Visualizing Dynamic Data with Maps[J].IEEE Transactions on Visualization and Computer Graphics,2012,18(9):1424-1437.
[16] GRONEMANN M,JüNGER M.Drawing Clustered Graphs as Topographic Maps[C]∥Proceedings of the 20th International Symposium.Berlin Heidelberg:Springer,2012:426-438.
[17] BIUK-AGHAI R P,PANG C I,SI Y W.Visualizing Large-scale Human Collaboration in Wikipedia[J].Future Generation Computer Systems,2014,31:120-133.
[18] AUBER D,HUET C,LAMBERT A,et al.Gospermap:Using a Gosper Curve for Laying Out Hierarchical Data[J].IEEE Transactions on Visualization and Computer Graphics,2013,19(11):1820-1832.
[19] 陳寧濤,王能超,陳瑩.Hilbert曲線的快速生成算法設(shè)計(jì)與實(shí)現(xiàn)[J].小型微型計(jì)算機(jī)系統(tǒng),2005,26(10):1754-1757.
CHEN Ningtao,WANG Nengchao,CHEN Ying.Fast Generation Algorithm Design and Realization of Hilbert Curve[J].Mini-micro Systems,2005,26(10):1754-1757.
[20] LAKOFF G,JOHNSON M.Metaphors We Live By:With A New Afterword[M].Chicago:University of Chicago Press,2008.
[21] FABRIKANT S I.Evaluating the Usability of the Scale Metaphor for Querying Semantic Spaces[C]∥Foundations of Geographic Information Science International Conference on Spatial Information Theory.Berlin Heidelberg:Springer,2001:156-172.
[22] 艾廷華,周夢(mèng)杰,陳亞婕.專(zhuān)題地圖屬性信息的LOD表達(dá)與TreeMap可視化[J].測(cè)繪學(xué)報(bào),2013,42(3):453-460.
AI Tinghua,ZHOU Mengjie,CHEN Yajie.The LOD Representation and TreeMap Visualization of Attribute Information in Thematic Mapping[J].Acta Geodaetica et Cartographica Sinica,2013,42(3):453-460.
[23] FURNAS G W.Generalized Fisheye Views[C]∥Proceedings of the SIGCHI Conference on Human Factors in Computing Systems.Boston,Massachusetts:ACM,1986:16-23.
[24] DENT B D.Communication Aspects of Value-by-Area Cartograms[J].The American Cartographer,1975,2(2):154-168.
[25] KEIM D A,PANSE C,NORTH S C.Medial-Axis-Based Cartograms[J].IEEE Computer Graphics and Applications,2005,25(3):60-68.
[26] GASTNER M T,NEWMAN M E J.Diffusion-Based Method for Producing Density-Equalizing Maps[J].Proceedings of the National Academy of Sciences of the United States of America,2004,101(20):7499-7504.
Visualisation and Analysis of Non-spatial Hierarchical Data of Gosper Map
XIN Rui,AI Tinghua,HE Yakun
School of Resource and Environmental Sciences,Wuhan University,Wuhan 430079,China
This study focuses on spatial metaphor expression and analysis of hierarchy data with the help of map metaphor. We use classic cartographic methods synthetically to process the non-spatial data to realize the spatialization. This process makes abstract data concrete which can reduce cognitive load. In addition,it expands the extension of cartography. In terms of specific methods,we use the landscape metaphor to reflect data feature,and introduce LOD and Cartogram into map metaphor which is suitable for hierarchy data’s structural characteristics. Comprehensive usage of above methods help highlight features of each layer of data and analyze data characteristics through the map. At last the validity of this method is verified by the real file hierarchy data. We conduct experiments to analyze file number distribution,large file location and file depth. The results show that our method can effectively express the hierarchical data and support some map analysis and data mining.
map metaphor; non-spatial data; hierarchical data; Gosper map; map expression; map analysis
The National Key Research and Development Program of China (No. 2017YFB0503500); The National Natural Science Foundation of China (No. 41531180) ;The National High Technology Research and Development Program of China (863 Program) (No. 2015AA124103)
XIN Rui (1991—),male,PhD candidate,majors in visual data mining and map metaphor.
AI Tinghua
E-mail: tinghuaai@whu.edu.cn
信睿,艾廷華,何亞坤.Gosper地圖的非空間層次數(shù)據(jù)隱喻表達(dá)與分析[J].測(cè)繪學(xué)報(bào),2017,46(12):2006-2015.
10.11947/j.AGCS.2017.20160596.
XIN Rui,AI Tinghua,HE Yakun.Visualisation and Analysis of Non-spatial Hierarchical Data of Gosper Map[J]. Acta Geodaetica et Cartographica Sinica,2017,46(12):2006-2015. DOI:10.11947/j.AGCS.2017.20160596.
P208
A
1001-1595(2017)12-2006-10
國(guó)家重點(diǎn)研發(fā)計(jì)劃(2017YFB0503500);國(guó)家自然基金重點(diǎn)項(xiàng)目(41531180);國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)(2015AA124103)
宋啟凡)
2016-11-22
2017-09-21
信睿(1991—),男,博士生,研究方向?yàn)榭梢暬诰蚝碗[喻地圖。
E-mail: xinrui@whu.edu.cn
艾廷華