曹巧云,何望君,張福浩,劉 濤,劉紀(jì)平,4
(1. 蘭州交通大學(xué)測繪與地理信息學(xué)院,甘肅 蘭州 730070; 2. 中國測繪科學(xué)研究院,北京 100830; 3. 地理國情監(jiān)測技術(shù)應(yīng)用國家地方聯(lián)合工程研究中心,甘肅 蘭州 730070; 4. 武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079; 5. 甘肅省地理國情監(jiān)測工程實驗室,甘肅 蘭州 730070)
隨著關(guān)系數(shù)據(jù)庫的發(fā)展迅速,全球數(shù)據(jù)量增長快,數(shù)據(jù)被不斷地生產(chǎn)出來,與此同時,人們對信息的要求越來越高[1];從海量數(shù)據(jù)中獲取隱藏的、有用的信息,導(dǎo)致數(shù)據(jù)管理人員對數(shù)據(jù)的查詢要求日趨繁瑣。數(shù)據(jù)立方體(DataCube)又稱多維數(shù)據(jù)集,是OLAP(on line transaction processing)系統(tǒng)的核心,為用戶數(shù)據(jù)構(gòu)建了多維視圖,針對數(shù)據(jù)的查看和分析,用戶可以利用數(shù)據(jù)立方體技術(shù)從多個視角出發(fā)[2]。眾多的OLAP產(chǎn)品具有基于多維數(shù)組構(gòu)建立方體模型的優(yōu)勢,易于管理和查詢海量數(shù)據(jù)。
文獻(xiàn)[3]總結(jié)了每一維度就是數(shù)據(jù)觀測的每一個視角,政府部門從不同行政級別查看隨時間推移的GDP的變化,這是從政區(qū)角度來查看GDP,因此政區(qū)是一個維;許多領(lǐng)域中提出了包含諸如數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、數(shù)據(jù)集成、OLAP等許多技術(shù)的商業(yè)智能(BI)的體系結(jié)構(gòu),它用于建立決策支持,優(yōu)先考慮有效查詢大量歷史,清潔和整合數(shù)據(jù)[4];文獻(xiàn)[5—7]將文本概念加入立方體;文獻(xiàn)[7]針對數(shù)據(jù)和文本分別建立維度,利用倒排方法檢索對應(yīng)的數(shù)據(jù);文獻(xiàn)[8]提出基于流數(shù)據(jù)的概要立方體,實現(xiàn)任意組合的維度映射成唯一的數(shù)值,此方法提高索引的效率,但都對政務(wù)地圖數(shù)據(jù)的OLAP研究較少。目前許多統(tǒng)計數(shù)據(jù)是圍繞國家或政區(qū)開展,戰(zhàn)略分析需要空間視角,針對以上問題,結(jié)合數(shù)據(jù)立方體聯(lián)機(jī)可視化方法,從空間維探索政務(wù)統(tǒng)計與政務(wù)電子地圖的可視化方法。本方法推進(jìn)政務(wù)電子地圖的管理和查詢的效率,同時在更多的角度上實現(xiàn)了對信息的理解和把握,提高了工作效率。
自20世紀(jì)60年代末關(guān)系型數(shù)據(jù)庫之父E.F.Codd提出關(guān)系型數(shù)據(jù)模型以來,關(guān)系型數(shù)據(jù)庫與OLAP得到了快速的發(fā)展[9]。加拿大拉瓦爾大學(xué)地理信息中心提供Spatial OLAP(SOLAP)作為支持快速簡便的時空分析,探索多維數(shù)據(jù)的工具,并提供一套可視化技術(shù),如地圖、表格和圖表[10]。巴西聯(lián)邦伯南布哥大學(xué)信息中心提出了GOLAPA(地理在線分析處理架構(gòu)),為用戶提供了查詢分析和地理數(shù)據(jù)以供決策支持所涉及的復(fù)雜性的抽象[11-12]。在將BI與GIS相結(jié)合的其他工具中,筆者引用Voss[13]提出的Cube View和Polaris,以便于觀察大量數(shù)據(jù)中的空間模式和時間趨勢。此外,文獻(xiàn)[14]開發(fā)了一個強(qiáng)大、易于訪問及用戶友好的Geo-BI地方治理基礎(chǔ)設(shè)施服務(wù)的解決方案。此外,有學(xué)者提出了一個可擴(kuò)展的GISOLAP集成解決方案,它基于一個名為GeoCube的正式多維模型,支持地理維度和度量[15]。更重要的是,Pitts大學(xué)提出了OLAP-GIS工具[16]的開發(fā),用于社區(qū)健康評估分析中的數(shù)值空間問題解決。文獻(xiàn)[17]提出支持地理維度和度量的GIS-OLAP集成解決方案,并提供交互式數(shù)據(jù)透視表和圖表顯示,有效地支持決策服務(wù),GIS-OLAP技術(shù)核心是“維”這個概念[18],建立多維數(shù)據(jù)模型是進(jìn)行GIS-OLAP分析的重要基礎(chǔ)。數(shù)據(jù)立方體作為GIS-OLAP系統(tǒng)的核心技術(shù),用于數(shù)據(jù)分析和索引的技術(shù)架構(gòu),能夠?qū)υ獢?shù)據(jù)進(jìn)行任意多關(guān)鍵字實時索引,并且加快了數(shù)據(jù)的查詢和檢索。如何將OLAP技術(shù)應(yīng)用到電子政務(wù)地圖,構(gòu)建政務(wù)決策支持系統(tǒng),利用電子政務(wù)綜合數(shù)據(jù)庫中存儲的大量數(shù)據(jù)建立正確的決策體系和決策支持模型,為各級政府的決策提供科學(xué)的依據(jù),從而提高政府辦公效率、促進(jìn)經(jīng)濟(jì)發(fā)展,目前已成為我國政府越來越緊迫的一項工作。
政務(wù)地圖和數(shù)據(jù)立方體融合技術(shù)包括維度規(guī)范化表達(dá)、數(shù)據(jù)立方體構(gòu)建和多維查詢3大技術(shù),如圖1所示。首先,對空間(政區(qū))進(jìn)行規(guī)范化表達(dá),實現(xiàn)空間(政區(qū))維度的規(guī)范化;然后,對政區(qū)統(tǒng)計的指標(biāo)數(shù)據(jù)進(jìn)行數(shù)據(jù)立方體的構(gòu)建,并對指標(biāo)數(shù)據(jù)進(jìn)行規(guī)范化管理;最后,結(jié)合OLAP技術(shù),對多維政區(qū)和政區(qū)統(tǒng)計數(shù)據(jù)立方體進(jìn)行聯(lián)機(jī)處理,實現(xiàn)政區(qū)地圖交互下的多維查詢可視化。
政區(qū)包括省、市、縣(區(qū))、鄉(xiāng)鎮(zhèn)(街道)4個維度,利用屬性編輯技術(shù)對對省、市、縣(區(qū))、鄉(xiāng)鎮(zhèn)(街道)地圖進(jìn)行統(tǒng)一編碼,實現(xiàn)政區(qū)地圖的規(guī)范化維度表達(dá)。第一,利用地圖數(shù)據(jù)處理軟件,統(tǒng)一省、市、縣(區(qū))、鄉(xiāng)鎮(zhèn)(街道)地圖數(shù)據(jù)的投影坐標(biāo),使地圖數(shù)據(jù)都在同一空間坐標(biāo)下顯示;第二,利用數(shù)據(jù)編輯工具實現(xiàn)省、市、縣(區(qū))、鄉(xiāng)鎮(zhèn)(街道)的統(tǒng)一編碼,如湖南省為43,實現(xiàn)對政區(qū)地圖的編碼管理;第三,利用數(shù)據(jù)立方體維度表達(dá)技術(shù),對省、市、縣(區(qū))、鄉(xiāng)鎮(zhèn)(街道)進(jìn)行統(tǒng)一編碼管理,建立統(tǒng)一的時間、多級政區(qū)維度,形成省、市、縣(區(qū))、鄉(xiāng)鎮(zhèn)(街道)4個維度,從而建立政區(qū)維度表。統(tǒng)一編碼的目的是實現(xiàn)政區(qū)的統(tǒng)一化管理,從地圖數(shù)據(jù)源中盡可能高效地管理所需要的地圖數(shù)據(jù)。
運(yùn)用數(shù)據(jù)立方體技術(shù),對政區(qū)和指標(biāo)數(shù)據(jù)進(jìn)行數(shù)據(jù)立方體的構(gòu)建,形成政區(qū)統(tǒng)計數(shù)據(jù)立方體。①描述維度表,針對4個維度的政區(qū)數(shù)據(jù),利用數(shù)據(jù)立方體維度構(gòu)建方法,增加省、市、縣(區(qū))、鄉(xiāng)鎮(zhèn)(街道)的編碼、名稱、描述等相關(guān)屬性,統(tǒng)一標(biāo)準(zhǔn)管理。②指標(biāo)表的構(gòu)建,根據(jù)現(xiàn)有省、市、縣(區(qū))、鄉(xiāng)鎮(zhèn)(街道)的指標(biāo)數(shù)據(jù),構(gòu)建人口表、GDP表、企業(yè)表等,通過統(tǒng)一的編碼實現(xiàn)與政區(qū)維度表的關(guān)聯(lián)。③數(shù)據(jù)轉(zhuǎn)換,將標(biāo)準(zhǔn)化處理后的政務(wù)維度數(shù)據(jù)和指標(biāo)數(shù)據(jù)添加到數(shù)據(jù)倉庫之前,需對這些數(shù)據(jù)進(jìn)行必要的轉(zhuǎn)換,轉(zhuǎn)換完畢的數(shù)據(jù)方可存放到相應(yīng)的數(shù)據(jù)倉庫中。數(shù)據(jù)轉(zhuǎn)換方法有簡單變換(包括編碼字段的解碼、日期/時間格式轉(zhuǎn)換、數(shù)據(jù)類型的轉(zhuǎn)換)、集成(就是把來自于不用數(shù)據(jù)中得到的業(yè)務(wù)數(shù)據(jù)結(jié)合在一起,并將它們集成為一個緊密結(jié)合的數(shù)據(jù)模型)、聚集和概括(就是按照某些屬性匯總這些數(shù)據(jù))。④添加到數(shù)據(jù)倉庫,數(shù)據(jù)轉(zhuǎn)換完成之后,將這些規(guī)范的數(shù)據(jù)添加到數(shù)據(jù)倉庫中。數(shù)據(jù)倉庫所需要加載的數(shù)據(jù)量很大,需采用標(biāo)準(zhǔn)的加載工具和共同的方法對加載的數(shù)據(jù)進(jìn)行處理。提高數(shù)據(jù)加載的效率,從而也能夠?qū)⒓虞d工具的定制最小化。
為了實現(xiàn)政區(qū)地圖的聯(lián)動查詢,采用數(shù)據(jù)立方體的多維分析技術(shù),操作步驟包括鉆取、上卷、切片、切塊和旋轉(zhuǎn)。①鉆?。涸诳臻g(政區(qū))維的不同層次間的變化,從頂層降到底層,拆分總數(shù)據(jù)到元數(shù)據(jù)。本文時間維上鉆查詢操作的結(jié)果就是日、周、月、季度、年,地區(qū)維上鉆查詢操作的結(jié)果就是鄉(xiāng)、縣、省、國。②上卷:從鄉(xiāng)鎮(zhèn)(街道)數(shù)據(jù)向省數(shù)據(jù)的聚合。③切片:選擇政區(qū)維中特定的指標(biāo)值進(jìn)行查詢或分析。④切塊:選擇空間(政區(qū))維中特定區(qū)間的指標(biāo)表數(shù)據(jù)進(jìn)行查詢分析。⑤旋轉(zhuǎn):政區(qū)維位置的互換,是行列的轉(zhuǎn)換。變換政區(qū)數(shù)據(jù)立方體維的角度,從不同的方向研究指標(biāo)數(shù)據(jù)在維上的分布。
點(diǎn)擊政區(qū)實現(xiàn)地圖下鉆,并且通過多維查詢語言,獲取當(dāng)前點(diǎn)擊政區(qū)數(shù)據(jù)集,實現(xiàn)數(shù)據(jù)立方體的自動下鉆。通過鉆取、上卷、切片、切塊及旋轉(zhuǎn)查詢操作,實現(xiàn)統(tǒng)計地圖和數(shù)據(jù)立方體雙向聯(lián)動,快速獲取數(shù)據(jù)并展示數(shù)據(jù)。
本次試驗選用全國作為研究區(qū)。試驗數(shù)據(jù)包括國家統(tǒng)計局統(tǒng)計年鑒獲取的2018年全國各省、市、縣的GDP數(shù)據(jù),國家統(tǒng)計官方網(wǎng)站獲取的省、市、縣、鄉(xiāng)鎮(zhèn)2010年全國第六次人口普查數(shù)據(jù),以及國家公共基礎(chǔ)地理信息平臺“天地圖”地圖數(shù)據(jù)和行政區(qū)劃數(shù)據(jù)。
實現(xiàn)全國、省級、市級、鄉(xiāng)鎮(zhèn)級的信息的可視化,利用網(wǎng)絡(luò)瀏覽器對地圖上的每個區(qū)域進(jìn)行不同的顏色顯示,可以方便直觀地查看出相應(yīng)的數(shù)據(jù)構(gòu)成,并將相應(yīng)地區(qū)的信息實時地顯示在右側(cè)的數(shù)據(jù)表中,方便具體地分析和處理,如圖2—圖3所示。
試驗結(jié)果分析發(fā)現(xiàn):在地理信息應(yīng)用政務(wù)電子地圖的平臺中,通過客戶端統(tǒng)計地圖的四色圖將不同區(qū)域的數(shù)據(jù)進(jìn)行了統(tǒng)一表格化表達(dá),實現(xiàn)了精細(xì)化、可配置的地理統(tǒng)計表達(dá)。方便使用者快速直觀地找到所需要的必要的數(shù)據(jù)信息。方便快捷地將政務(wù)地圖與數(shù)據(jù)立方體進(jìn)行集成整合,滿足平臺查詢與分析的功能,提供靈活豐富的功能接口和智能化的界面操作,賦予了專題圖更加便捷的管理分析功能,通過少量開發(fā)工作即可實現(xiàn)電子政務(wù)地圖統(tǒng)計與數(shù)據(jù)立方體的集成和使用。
在眾多政務(wù)服務(wù)過程中,存在大量的政區(qū)統(tǒng)計信息,存在如空間、時間、行業(yè)、主題等多類型、多層次的維度統(tǒng)計方式,筆者建議在信息資源整合時建立統(tǒng)一的空間維度和時間維度,不僅強(qiáng)化維度描述的一致性,而且支持不同維度不同層面的靈活細(xì)分和匯總分析,滿足不同分析的需求。將傳統(tǒng)的政區(qū)地圖與空間數(shù)據(jù)立方體進(jìn)行融合,在線統(tǒng)計并聯(lián)動顯示各級政區(qū)不同指標(biāo)數(shù)量和分布,實現(xiàn)國家、省、市、縣、鄉(xiāng)鎮(zhèn)多級數(shù)據(jù)立方體下鉆和上卷操作,便于決策者快速瀏覽和分析區(qū)域發(fā)展現(xiàn)狀和分布格局,有利于開展綜合性政務(wù)數(shù)據(jù)空間對比和關(guān)聯(lián)分析。