徐少坤,宋國民,王海葳,陳令羽
(1.信息工程大學(xué) 地理空間信息學(xué)院,河南 鄭州 450052;2.75719部隊,湖北 武漢 430074)
地理空間元數(shù)據(jù)有助于用戶從海量數(shù)據(jù)中快速、準(zhǔn)確地發(fā)現(xiàn)、訪問、獲取和使用所需的數(shù)據(jù)。元數(shù)據(jù)的自動搜索方法可以提高數(shù)據(jù)的使用效率,但也存在以下不足:搜索的結(jié)果通常以列表的形式顯示,用戶還要在搜索結(jié)果中進(jìn)行“二次檢索”;當(dāng)用戶不能準(zhǔn)確描述所需信息時,無法獲得數(shù)據(jù)的整體概況。提高元數(shù)據(jù)搜索的可用性和有效性已成為一個突出問題。
信息可視化將元數(shù)據(jù)集的空間、屬性和時間的外部形式和內(nèi)部特征等抽象數(shù)據(jù),以人能感知的形式表現(xiàn)出來。用戶可以選擇合適的元數(shù)據(jù)要素來探索和比較不同的數(shù)據(jù)集,同時改變參數(shù)來瀏覽所有可用的元數(shù)據(jù)資源,提高檢索效率。
信息可視化(Information Visualization)是將抽象數(shù)據(jù)用可視的形式表示出來,用于揭示抽象信息之間的關(guān)系和信息中隱藏的特征[1]。Card等人提出了信息可視化的參考模型(見圖1),將可視化概括為從數(shù)據(jù)到可視化形式再到人的感知系統(tǒng)可調(diào)節(jié)的映射[2]。數(shù)據(jù)檢索是信息可視化的核心,目的在于形象化地表達(dá)信息,發(fā)現(xiàn)新的知識,識別信息在結(jié)構(gòu)、模式、非規(guī)則、趨勢等方面的規(guī)律。
圖1 信息可視化參考模型
信息可視化作為可視化研究的新領(lǐng)域,廣泛應(yīng)用于知識發(fā)現(xiàn)、信息檢索、數(shù)字圖書館和信息理解等方面。綜合起來,其研究主要集中在以下幾個方面。
1)層次信息可視化。層次信息可視化最直觀的形式是樹型結(jié)構(gòu)。其研究重點(diǎn)在于既要獲得整體層次結(jié)構(gòu),又要便于快速查找所需節(jié)點(diǎn),并用更多的可視空間來顯示用戶關(guān)注的信息。應(yīng)用廣泛的有圓錐樹、雙曲線樹、圓形嵌套[3]等。
2)多維信息可視化。將多維度、多屬性的信息映射為直觀的形式是信息可視化的重要目標(biāo)。特別是在數(shù)據(jù)倉庫和信息挖掘中,一般采用坐標(biāo)變換、嵌套以及多視圖等技術(shù)將多維信息映射到二維平面或三維空間中[4]。代表性的有散點(diǎn)圖、平行坐標(biāo)和自組織映射[5]等。
3)文本信息可視化。利用可視化技術(shù)快速地從海量文本信息中獲取所需的內(nèi)容和知識,也是信息可視化關(guān)注的目標(biāo)。根據(jù)文本內(nèi)容的大小,文本信息可視化分為單文檔可視化和大型文檔集合可視化。
4)Web可視化。Web信息空間呈網(wǎng)狀結(jié)構(gòu),Web可視化的研究內(nèi)容包括信息搜索的可視界面、網(wǎng)頁導(dǎo)航和布局以及網(wǎng)絡(luò)節(jié)點(diǎn)的動態(tài)顯示和交互控制[6]。根據(jù)網(wǎng)站的規(guī)模,Web可視化可分為單網(wǎng)站可視化和網(wǎng)站集合可視化。清華大學(xué)網(wǎng)站可視圖是比較典型的Web可視化例子[7]。
地理空間元數(shù)據(jù)是指地理空間數(shù)據(jù)集和相關(guān)信息資源的描述信息,是對空間特征的概括和抽取[8]。許多國家、研究機(jī)構(gòu)都制定了相關(guān)的元數(shù)據(jù)標(biāo)準(zhǔn),代表性的有美國聯(lián)邦數(shù)據(jù)委員會起草的CSDGM和國際標(biāo)準(zhǔn)化組織制定的ISO/FDIS 19115。
大部分的元數(shù)據(jù)服務(wù)僅作為一個功能模塊集成在各種GIS平臺上,只提供簡單的數(shù)據(jù)查詢與顯示服務(wù)。將可視化應(yīng)用于地理空間元數(shù)據(jù)服務(wù)是一個新思路,國內(nèi)在這方面的研究較少。應(yīng)用成熟的有“香港賽馬會滑坡防治與咨詢中心”項(xiàng)目,該項(xiàng)目將元數(shù)據(jù)信息以圖的形式表達(dá)出來,使用戶提前知道所需數(shù)據(jù)的存在狀況[9]。
國外的地理空間元數(shù)據(jù)服務(wù)發(fā)展比較成熟,在理論模型、可視化技術(shù)和應(yīng)用工具等方面已進(jìn)行深入研究。Card等人認(rèn)為:“元數(shù)據(jù)與其他知識結(jié)構(gòu)中的復(fù)雜數(shù)據(jù),都是高維多變量的,信息可視化技術(shù)可以輔助其發(fā)現(xiàn)規(guī)律”[10]。Kraak和Ormeling提出地理空間元數(shù)據(jù)的可視化環(huán)境體現(xiàn)在3個方面:地理可視化、多元可視化及設(shè)計以人為中心的可視化[11]。Yang,Ward和Rundensteiner等提出交互式層次顯示技術(shù)將是海量數(shù)據(jù)顯示的有效工具[12]。
在地理空間元數(shù)據(jù)可視化設(shè)計過程中,任務(wù)需求、用戶和元數(shù)據(jù)規(guī)格參數(shù)是影響數(shù)據(jù)搜索的3大因素[13]。
1)地理空間元數(shù)據(jù)可視化的任務(wù)需求。用戶不同的任務(wù)需求,對元數(shù)據(jù)的關(guān)注點(diǎn)和要素的選擇也不盡相同。在元數(shù)據(jù)的搜索過程中,這會影響可視化表現(xiàn)形式、可視化應(yīng)用模式和搜索精度。用戶在評價某一數(shù)據(jù)集是否滿足需求時,需要權(quán)衡多個準(zhǔn)則進(jìn)行判斷,不同的任務(wù)需求,決定因素和要素的權(quán)重值也各不相同[14]。比如,以研究分析為目的,會注重于數(shù)據(jù)的現(xiàn)勢性和真實(shí)性;以量測為目的,會注重于數(shù)據(jù)精度和空間準(zhǔn)確性;數(shù)據(jù)的管理則更關(guān)注管理成本和用戶權(quán)限。
2)地理空間元數(shù)據(jù)服務(wù)的用戶。大部分的元數(shù)據(jù)用戶也是GIS應(yīng)用程序的用戶,這些用戶涵蓋從商業(yè)程序的最終用戶到新環(huán)境、新語言的研究者。另外,程序和軟件開發(fā)者、數(shù)據(jù)管理者、數(shù)據(jù)生產(chǎn)商也會使用元數(shù)據(jù)。針對各種類型的用戶,分析其需求和關(guān)注點(diǎn),以滿足其不同層次、不同階段的服務(wù)需求。
3)地理空間元數(shù)據(jù)的規(guī)格參數(shù)。為滿足廣泛的應(yīng)用需求,地理空間元數(shù)據(jù)標(biāo)準(zhǔn)制定了詳細(xì)的元數(shù)據(jù)要素。但并不是所有要素都有明確的意義,都值得用戶去關(guān)注。要根據(jù)用戶類型和任務(wù)需求,結(jié)合元數(shù)據(jù)的規(guī)格參數(shù),分析用戶可能關(guān)注的元數(shù)據(jù)要素,并提供相似的要素滿足其潛在的需求。
地理空間元數(shù)據(jù)的可視化技術(shù),根據(jù)元數(shù)據(jù)要素的個數(shù)可分為單要素可視化和多要素可視化。
2.2.1 單要素可視化技術(shù)
地理空間元數(shù)據(jù)單要素的可視化,可以采用傳統(tǒng)的信息可視化方法,如條形統(tǒng)計圖、柱狀圖、折線圖、餅圖、散點(diǎn)圖、顏色編碼等。
對于簡單的二維數(shù)據(jù),散點(diǎn)圖(scatterplot)是比較常見的可視化方法。例如,2個元數(shù)據(jù)要素,可以映射為二維坐標(biāo)上的一系列點(diǎn),進(jìn)而獲得數(shù)據(jù)的整體趨勢。柱狀圖是數(shù)據(jù)比較的有效形式,能直觀地顯示單一要素的分布情況,不同顏色的柱狀更利于數(shù)據(jù)的快速選擇和整體趨勢的有效反映。
單要素可視化形式多樣,結(jié)構(gòu)簡單??赏ㄟ^分析各種形式的特點(diǎn),對元數(shù)據(jù)單要素采用合適的表現(xiàn)形式;同時可將多種可視化形式組合起來,為用戶提供潛在的、相關(guān)的信息。
2.2.2 多要素可視化技術(shù)
地理空間元數(shù)據(jù)多要素可視化一般是指3個或3個以上元數(shù)據(jù)要素的可視化,其表現(xiàn)形式要求既能清晰地反映大數(shù)據(jù)集的整體趨勢,又能快速查找所需的元數(shù)據(jù)。可應(yīng)用于地理空間元數(shù)據(jù)可視化的技術(shù)主要有以下幾種:
2.2.2.1 多維可視化技術(shù)
1)散點(diǎn)圖矩陣。對散點(diǎn)圖進(jìn)行適當(dāng)?shù)母倪M(jìn),可用于元數(shù)據(jù)多要素的可視化表達(dá)。其中一種方法是把元數(shù)據(jù)的每個要素,用不同的圖形、顏色、紋理等表示在二維坐標(biāo)上。
散點(diǎn)圖矩陣(見圖2)也是一種有效的可視化方式。它將元數(shù)據(jù)多個要素兩兩組合作為矩陣中的一個元素,在每一矩陣中繪制相應(yīng)要素的散點(diǎn)圖,從各個要素屬性的兩兩比較中得到隱含的信息。散點(diǎn)圖矩陣是區(qū)別元數(shù)據(jù)整體趨勢和局部特征的簡單方法,能直觀地解釋所有任意2個要素之間的關(guān)系,而不受數(shù)據(jù)集大小和要素個數(shù)的限制[5]。
圖2 散點(diǎn)圖矩陣
2)平行坐標(biāo)。平行坐標(biāo)(見圖3)是在二維空間中采用等距離、豎直多條平行坐標(biāo)軸表示多維空間,坐標(biāo)軸取值范圍從相應(yīng)數(shù)據(jù)維屬性的最小值到最大值均勻分布。平行坐標(biāo)中數(shù)據(jù)關(guān)系的表達(dá)直觀,易于理解,有助于發(fā)現(xiàn)大規(guī)模數(shù)據(jù)之間復(fù)雜關(guān)系。
圖3 平行坐標(biāo)
平行坐標(biāo)將用戶搜索的元數(shù)據(jù)要素映射為平行坐標(biāo)軸,根據(jù)關(guān)鍵詞的重要性設(shè)置相應(yīng)的坐標(biāo)軸順序。搜索結(jié)果以各個軸之間的連線顯示,用戶可交互式地添加或刪除要素。當(dāng)數(shù)據(jù)量比較大時,坐標(biāo)軸之間的線可能比較多,要素間的關(guān)系會模糊不清,可對線進(jìn)行半透明化處理[15],其顏色的深淺反映元數(shù)據(jù)的趨勢特征;當(dāng)數(shù)據(jù)量較少時,平行坐標(biāo)有利于用戶快速查找所需的結(jié)果。
散點(diǎn)圖和平行坐標(biāo)的結(jié)合可以獲得整體趨勢和局部特征的優(yōu)化形式。在平行坐標(biāo)軸之間顯示散點(diǎn)圖,軸之間的直線變成穿過散點(diǎn)圖的曲線,這樣既保持了平行坐標(biāo)里的連接關(guān)系,又能用散點(diǎn)圖表示平行坐標(biāo)里無法表現(xiàn)的數(shù)據(jù)趨勢[16]。
2.2.2.2 圖標(biāo)顯示技術(shù)
基本思路是用多個可視特征圖標(biāo)來表示多維信息,圖標(biāo)每一個可視特征表示多維信息中一維,該方法適合為數(shù)不多并且在二維平面上具有良好展開特性的數(shù)據(jù)集[5]。常用的圖標(biāo)顯示技術(shù)有Chernoff面法和星繪法。Chernoff面法中面部表情不適合量化分析,并且容易干擾用戶對數(shù)據(jù)的理解,所以Chernoff面法在元數(shù)據(jù)可視化方面應(yīng)用較少。
1)星繪法。星繪法(見圖4)是從一點(diǎn)向外等角度地繪制發(fā)散的線段,線段的長度表示要素屬性值的大小,連接各條線段的終點(diǎn)形成星狀的圖形。元數(shù)據(jù)多要素可視化時,將要素的屬性值對應(yīng)為輻條的長度,數(shù)據(jù)集以相應(yīng)的星狀圖表示。星狀圖越完整,形狀越大,表示數(shù)據(jù)越符合設(shè)定的需求。
圖4 星繪法
Elena,F(xiàn)anea等提出了Parallel-Glyphs方法[17],將星繪法與平行坐標(biāo)結(jié)合起來,取得了較好的可視效果。
2.2.2.3 層次可視化技術(shù)
對于海量數(shù)據(jù)的表達(dá),層次可視化技術(shù)是顯示不同層次、大規(guī)模數(shù)據(jù)的有效工具。層次可視化技術(shù)可以為某個主題的要素屬性提供相關(guān)信息的整體概覽,并將更多的可視空間分配給用戶關(guān)注的部分分支。應(yīng)用比較廣泛的有空間樹和雙曲線樹。
1)空間樹。空間樹(見圖5)是采用點(diǎn)—線形式和收縮—展開方法來實(shí)現(xiàn)層次結(jié)構(gòu)的可視化技術(shù)[3]。當(dāng)用戶點(diǎn)擊相應(yīng)分支時,就展開下一級分支信息,可用顏色和形狀標(biāo)記焦點(diǎn)和根節(jié)點(diǎn)之間路徑。
圖5 空間樹
2)雙曲線樹。雙曲線樹(見圖6)是一種利用雙曲平面布局和“焦點(diǎn)+上下文”的可視化技術(shù),將用戶關(guān)注的細(xì)節(jié)顯示在平面中心,保證整個層次結(jié)構(gòu)的完全顯示。例如,對“延坪島炮擊事件”進(jìn)行可視化,可將延坪島作為根節(jié)點(diǎn),其海島地理位置、地形狀況和周邊海域水文狀況等都可以作為其子節(jié)點(diǎn),子節(jié)點(diǎn)可繼續(xù)擴(kuò)展到軍事設(shè)施分布、數(shù)據(jù)更新時間、數(shù)據(jù)來源等下一層次信息。用戶點(diǎn)擊相應(yīng)節(jié)點(diǎn)可使其顯示在中心位置,獲得放大的局部信息。
圖6 雙曲線樹
地理空間元數(shù)據(jù)可視化應(yīng)用流程可以描述為“先總體瀏覽,再移動和過濾,最后放大所需信息”。如圖7所示,圖7中a表示用戶在使用地理空間元數(shù)據(jù)庫時,首先會限定搜索范圍,如用戶輸入感興趣區(qū)域的名稱或在地圖上選擇特定的位置或范圍。在搜索結(jié)果中,用戶可根據(jù)需要在界面上選擇關(guān)鍵的元數(shù)據(jù)要素,確定優(yōu)先考慮的選項(xiàng)(見圖7中b)。系統(tǒng)會根據(jù)用戶選擇的要素,繪制所需元數(shù)據(jù)要素的可視化視圖,其中圖7中c顯示了星繪法和平行坐標(biāo)法2種可視化形式。用戶可以交互式地刷新和選擇元數(shù)據(jù)視圖,也可以根據(jù)需要打開或關(guān)閉不同的可視化視圖,直到找到合適的數(shù)據(jù)集,并在地圖上研究其地理內(nèi)容。數(shù)據(jù)集的內(nèi)容以圖像和文本元數(shù)據(jù)的形式提供給用戶,圖7中d顯示了地圖和元數(shù)據(jù)要素列表兩種形式。
圖7 地理空間元數(shù)據(jù)可視化應(yīng)用流程[13]
隨著測控技術(shù)和互聯(lián)網(wǎng)絡(luò)的發(fā)展,人類獲取的空間信息數(shù)量呈幾何級增長,豐富的空間信息資源促進(jìn)基礎(chǔ)地理信息建設(shè)和元數(shù)據(jù)服務(wù)的日益完善。因此,面對海量數(shù)據(jù),高效、準(zhǔn)確的空間數(shù)據(jù)檢索將是影響數(shù)據(jù)服務(wù)和信息共享的重要因素。
信息可視化技術(shù)作為揭示抽象信息之間關(guān)系和特征的有力工具,有助于提高元數(shù)據(jù)服務(wù)的有效性和可用性。元數(shù)據(jù)服務(wù)的發(fā)展趨勢將以信息可視化技術(shù)為基礎(chǔ),結(jié)合地理空間元數(shù)據(jù)的特點(diǎn),分析元數(shù)據(jù)可視化的影響因素和應(yīng)用流程,為不同類型、不同需求的用戶,提供高效可靠的解決方案。
[1]馮藝東,汪國平,董士海.信息可視化[J].工程圖學(xué)學(xué)報,2001(2):324-329.
[2]Card S,Mackinlay J,Shneiderman B.Readings in information visualization:using vision to think[R].San Francisco:Morgan Kaufmann,1999.
[3]肖衛(wèi)東,孫揚(yáng).層次信息可視化技術(shù)研究綜述[J].小型微型計算機(jī)系統(tǒng),2011(1):137-146.
[4]程時偉,孫守遷.信息可視化研究綜述[J].中國科技論文在線.http://www.paper.edu.cn
[5]孫揚(yáng),封孝生,唐九陽,等.多維可視化技術(shù)綜述[J].計算機(jī)科學(xué),2008,35(11):1-7,59.
[6]張馳,羅鐵堅,王相根.基于Web的信息可視化系統(tǒng)的設(shè)計與實(shí)現(xiàn)[J].計算機(jī)系統(tǒng)應(yīng)用,2009(12):324-329.
[7]周寧,吳佳鑫,張少龍.基于圖的Web信息可視化探析[J].情報學(xué)報,2008,27(5):714-720.
[8]汪小林,羅英偉,叢升日,等.空間元數(shù)據(jù)研究及應(yīng)用[J].計算機(jī)研究與發(fā)展,2001,38(3):321-326.
[9]李軍.地球空間元數(shù)據(jù)的使用研究[J].地球信息科學(xué),2000(9):8-13.
[10]Lbertoni,R,Bertone.Knowledge extraction by visual data mining of metadata in site planning[C].Proceedings of Ninth Scandinavian Research Conference on Geographical Information Siences,Espoo:5-166.
[11]Aula Ahonen-Rainio.Visalization of geospatial metadata for selecting geographic datasets[D].Helsinki University of Technology,2005.
[12]Yang,J,Ward,M O.Rundenstein.Interactive hierarchical displays:ageneral framework for visualization and exploration of large multivariate data sets[J].Computers&Geosciences,2003(27):265-283.
[13]J Dykes,A M MacEachren,M J Kraak.Towards Multivariate Visualization of Metadata Describing Geographic Information[M].Exploring Geovisualization,2005.
[14]Potjo Tsoene.Visualizations of metadata in a GDI environment[D].International Institute for Geo-information Science and Earth Observation.2004.
[15]Chad Jones,et al.An Integrated Exploration Approach to Visualizing Multivariate Particle Data[J].Computing in Science &Engineering,2008,10(4):20-29.
[16]Xiaoru Yuan,et al.Scattering Points in Parallel Coordinates[J].IEEE Transactions on Visualzation and Computer Graphics.2009,15(6).
[17]Fanea E.An Interactive 3D Integration of Parallel Coordinates and Star Glyphs[R].IEEE Symposium on Information Visualization 2005.