劉文軍,吳俐民,方源敏
(1.深圳市勘察測繪院有限公司,廣東深圳 518028;2.昆明市測繪管理中心,云南昆明 650093;3.昆明理工大學(xué)國土資源工程學(xué)院,云南昆明 650093)
隨著“十二五”規(guī)劃的頒布及實(shí)施,“數(shù)字城市”的建設(shè)已成為各個省份的重頭戲?!皵?shù)字城市”所產(chǎn)生的數(shù)據(jù)表現(xiàn)為多類型、多尺度、多語義等特性。正是由于數(shù)據(jù)的多源性和異構(gòu)性的存在,使得數(shù)據(jù)共享與信息交換變得十分困難,被稱為“信息孤島”[1]。為了建設(shè)好各省的基礎(chǔ)地理信息公共服務(wù)平臺,便于實(shí)現(xiàn)GIS數(shù)據(jù)和信息的持續(xù)利用,必須將這些多源異構(gòu)的空間數(shù)據(jù)進(jìn)行集成,最終整合成統(tǒng)一標(biāo)準(zhǔn)的數(shù)據(jù)。
對于多源異構(gòu)空間數(shù)據(jù)集成的研究,國內(nèi)外已有相關(guān)文獻(xiàn)。Timo thy L.N yerges于1989 年[2]就地球空間數(shù)據(jù)集成的結(jié)構(gòu)、步驟和方法進(jìn)行了討論;Dan Lee于1993 年[3]和 C.B.Jones于1996 年[4]在數(shù)據(jù)多尺度問題上進(jìn)行了研究;2000年李軍、費(fèi)云川[5]在理論上,對地球空間數(shù)據(jù)集成研究狀況及存在的問題做了詳細(xì)的分析,并初步概括了地球空間數(shù)據(jù)集成的發(fā)展方向。同年,宋關(guān)福、鐘耳順等人[6,7]提出了多源空間數(shù)據(jù)無縫集成(SMIS)技術(shù),并探討了SMIS技術(shù)在GIS軟件開發(fā)中的應(yīng)用;有關(guān)這方面的研究還有很多[8~10]。以上的文獻(xiàn)主要是針對空間數(shù)據(jù)集成的理論和常用的解決方案的研究,將ETL技術(shù)與GIS技術(shù)結(jié)合的文獻(xiàn)卻很少?;谝陨系姆治雠c不足,本文嘗試在多源異構(gòu)空間數(shù)據(jù)集成理論基礎(chǔ)上,采用ETL技術(shù),在預(yù)先定義好的抽取規(guī)則和轉(zhuǎn)換規(guī)則下,進(jìn)行了數(shù)據(jù)的集成抽取、清洗、轉(zhuǎn)換,最后裝載到框架數(shù)據(jù)庫。
地理空間數(shù)據(jù)是GIS的操作對象,是GIS所表達(dá)的現(xiàn)實(shí)世界經(jīng)過模型抽象的實(shí)質(zhì)性內(nèi)容[11]。可以從地理數(shù)據(jù)來源和表現(xiàn)形式來分析空間數(shù)據(jù)的多源異構(gòu)性。
從地理數(shù)據(jù)來源分析:目前,地理數(shù)據(jù)的來源有現(xiàn)存的地圖數(shù)據(jù)、遙感影像數(shù)據(jù)、用全站儀或GPS實(shí)測的數(shù)據(jù)、國民經(jīng)濟(jì)的各種統(tǒng)計數(shù)據(jù)等,其來源廣泛。而不同的數(shù)據(jù)源或采集方式不同的數(shù)據(jù),所應(yīng)用的軟件也不同,最終導(dǎo)致這些數(shù)據(jù)的存儲格式及結(jié)構(gòu)都各不相同,這就增加了數(shù)據(jù)重復(fù)建設(shè)的成本。
從地理數(shù)據(jù)的表現(xiàn)形式分析[11]:由于地理數(shù)據(jù)表達(dá)的是現(xiàn)實(shí)世界中具有幾何特征的對象,如地貌、海拔、植被、河流、建筑等,所表達(dá)對象的多樣決定了地理數(shù)據(jù)的多語義性;不同的GIS專題應(yīng)用系統(tǒng),對數(shù)據(jù)的比例尺和精度要求也有很大的差異,同時也存在著同一時間不同空間的數(shù)據(jù)以及同一空間在不同時間的數(shù)據(jù),因而地理數(shù)據(jù)表現(xiàn)出多時空性和多尺度性;由于GIS軟件層出不窮,不同的GIS軟件平臺都有自己所支持的數(shù)據(jù)格式,如Esri公司的ARC/INFO Coverage、Shapefile格式;AutoCAD的 DXF格式、DWG格式;MapInfo的MID、MIF格式等,這又導(dǎo)致了地理數(shù)據(jù)的存儲格式多樣性。
正因?yàn)榈乩砜臻g數(shù)據(jù)的多源異構(gòu)性的存在,使得地理空間數(shù)據(jù)的共享和集成問題日益突出,因此,有必要將多源異構(gòu)空間數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的標(biāo)準(zhǔn)格式的框架數(shù)據(jù),達(dá)到不同GIS應(yīng)用系統(tǒng)或各個業(yè)務(wù)部門數(shù)據(jù)共享的目的。
ETL是數(shù)據(jù)抽取(Extract)、轉(zhuǎn)換(Transform)、裝載(Load)的過程[12]。是構(gòu)建數(shù)據(jù)倉庫的重要一環(huán),用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗,最終按照預(yù)先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。具體地說,ETL包括三個主要的環(huán)節(jié),一是數(shù)據(jù)抽取,將數(shù)據(jù)從不同的操作平臺或者數(shù)據(jù)庫等那些最初的業(yè)務(wù)系統(tǒng)中讀取出來,是所有工作的前提;二是數(shù)據(jù)轉(zhuǎn)換,是對抽取得到的數(shù)據(jù),在預(yù)先定義好的轉(zhuǎn)換規(guī)則下,進(jìn)行轉(zhuǎn)換的過程,包括字段的合并與拆分、排序、賦缺省值以及數(shù)據(jù)的聚合等操作;三是數(shù)據(jù)裝載,負(fù)責(zé)將轉(zhuǎn)換完成的數(shù)據(jù)裝載到數(shù)據(jù)倉庫中。其概模型如圖1所示。
圖1 ETL概念模型圖
ETL是建立數(shù)據(jù)倉庫的必要步驟,而數(shù)據(jù)倉庫的建立是為了滿足大多數(shù)遺留下來的異構(gòu)的系統(tǒng)、應(yīng)用、商務(wù)流程以及數(shù)據(jù)源構(gòu)成的應(yīng)用環(huán)境所需,以實(shí)現(xiàn)“數(shù)據(jù)集中化、業(yè)務(wù)綜合化、管理扁平化、決策科學(xué)化”目的[13]。為此,ETL技術(shù)主要應(yīng)用于商業(yè)智能方面[14~17],其數(shù)據(jù)來自于各個部門的人文數(shù)據(jù)、經(jīng)濟(jì)數(shù)據(jù)或業(yè)務(wù)數(shù)據(jù)等。
ETL在商業(yè)智能方面的應(yīng)用較廣泛,但其數(shù)據(jù)主要來源于不同部門的人文數(shù)據(jù)、經(jīng)濟(jì)數(shù)據(jù)或業(yè)務(wù)數(shù)據(jù)等,而并非是帶有地理實(shí)體屬性信息的空間數(shù)據(jù)。為此,本文嘗試將地理空間數(shù)據(jù)作為ETL的數(shù)據(jù)源,探討基于ETL的多源異構(gòu)空間數(shù)據(jù)集成模式的研究。
由于不同GIS軟件系統(tǒng)之間圖形數(shù)據(jù)格式的不同,使得空間數(shù)據(jù)的共享成為難題。目前GIS產(chǎn)業(yè)界實(shí)現(xiàn)數(shù)據(jù)共享與集成的方式大致三種,即:數(shù)據(jù)格式轉(zhuǎn)換模式、數(shù)據(jù)互操作模式和直接數(shù)據(jù)訪問模式。
(1)數(shù)據(jù)格式轉(zhuǎn)換模式
數(shù)據(jù)格式轉(zhuǎn)換模式就是把其他格式的數(shù)據(jù)經(jīng)過專門的數(shù)據(jù)轉(zhuǎn)換程序轉(zhuǎn)換成該系統(tǒng)的數(shù)據(jù)格式,并復(fù)制到當(dāng)前系統(tǒng)的數(shù)據(jù)庫或文件中。這是一種傳統(tǒng)的GIS數(shù)據(jù)集成方法,也是當(dāng)前GIS軟件系統(tǒng)數(shù)據(jù)共享與集成的主要辦法。目前,業(yè)界公認(rèn)的幾種重要的空間數(shù)據(jù)格式有:Esri公司的ArcInfo Coverage、Shapefile和E00格式;AutoDesk的DXF格式和DWG格式;MapInfo的MIF格式和MID格式;Intergraph的DGN格式等等[7]。
數(shù)據(jù)格式轉(zhuǎn)換模式存在的一些弊病有:一是信息丟失問題。由于在空間對象中缺乏統(tǒng)一的描述方法,不同格式數(shù)據(jù)所描述的空間數(shù)據(jù)模型不盡相同。DXF格式著重描述空間對象的圖形表達(dá)(顏色、線型)等,而忽略了屬性數(shù)據(jù)和空間對象之間的拓?fù)潢P(guān)系;E00格式側(cè)重于描述空間對象的關(guān)系(如拓?fù)潢P(guān)系)而忽略了其圖形表達(dá)能力。因此,CAD數(shù)據(jù)輸出為E00格式將丟失顏色、線型等信息;而ArcInfo數(shù)據(jù)輸出到DXF時則會損失拓?fù)潢P(guān)系和屬性數(shù)據(jù)等有價值的信息;二是數(shù)據(jù)轉(zhuǎn)換過程復(fù)雜。要想將a格式的數(shù)據(jù)轉(zhuǎn)換成b格式的數(shù)據(jù),首先要使用軟件A將a格式數(shù)據(jù)輸出為中間格式,再使用軟件B輸入已轉(zhuǎn)換的中間格式,最終輸出為b格式數(shù)據(jù)。尤其是在數(shù)據(jù)不斷更新的情況下,不同GIS系統(tǒng)的數(shù)據(jù)格式轉(zhuǎn)換及其頻繁而復(fù)雜。
(2)數(shù)據(jù)互操作模式
數(shù)據(jù)互操作模式是OpenGIS Consortium(OGC)制定的規(guī)范。GIS互操作是指在異構(gòu)數(shù)據(jù)庫和分布計算的情況下,GIS用戶在相互理解的基礎(chǔ)上,能透明地獲取所需的信息[18]。OGC為數(shù)據(jù)互操作制定了統(tǒng)一的規(guī)范,從而使得一個系統(tǒng)同時支持不同的空間數(shù)據(jù)格式成為可能。根據(jù)OGC頒布的規(guī)范,數(shù)據(jù)服務(wù)器(Data Servers)是指提供數(shù)據(jù)源的軟件,數(shù)據(jù)客戶(Data Clients)是指使用數(shù)據(jù)的軟件,數(shù)據(jù)客戶使用某種數(shù)據(jù)的過程就是發(fā)出數(shù)據(jù)請求,由數(shù)據(jù)服務(wù)器提供服務(wù)的過程,其最終目的是使數(shù)據(jù)客戶能讀取任意數(shù)據(jù)服務(wù)器提供的空間數(shù)據(jù)。
數(shù)據(jù)互操作規(guī)范為多源數(shù)據(jù)集成帶來了新的模式,但是這一模式在實(shí)際應(yīng)用中存在著缺陷,究其原因是:其一是一個軟件要訪問其他軟件的數(shù)據(jù)是通過數(shù)據(jù)服務(wù)器(即被訪問數(shù)據(jù)格式的宿主軟件)來實(shí)現(xiàn)的,因此用戶必須同時擁有這兩個GIS軟件,并且同時運(yùn)行,才能完成整個數(shù)據(jù)互操作過程;其二是每種格式的宿主軟件都要按照統(tǒng)一的規(guī)范實(shí)現(xiàn)數(shù)據(jù)訪問接口,才能真正實(shí)現(xiàn)數(shù)據(jù)互操作。
(3)直接數(shù)據(jù)訪問模式
直接數(shù)據(jù)訪問是在一個GIS軟件中通過利用空間數(shù)據(jù)引擎的方法來實(shí)現(xiàn)對其他軟件數(shù)據(jù)格式的直接訪問、存取和空間分析[7]。直接數(shù)據(jù)訪問不僅避免了繁瑣的數(shù)據(jù)轉(zhuǎn)換過程,而且在一個GIS軟件中訪問某種軟件的數(shù)據(jù)格式不要求用戶擁有該數(shù)據(jù)格式的宿主軟件,也不需要運(yùn)行該軟件。
從上述角度來看,直接數(shù)據(jù)訪問提供了一種更為經(jīng)濟(jì)實(shí)用的多源數(shù)據(jù)共享模式。但是直接數(shù)據(jù)訪問同樣存在著一些不足之處:一是由于空間數(shù)據(jù)格式多樣性的存在,使得不同GIS軟件數(shù)據(jù)組織各不相同,沒有一個專門的軟件能夠支持所有數(shù)據(jù)格式直接訪問;二是客戶軟件要為每一種要直接訪問的宿主軟件數(shù)據(jù)格式編寫讀寫驅(qū)動,在宿主軟件數(shù)據(jù)格式不公開,或者宿主軟件數(shù)據(jù)格式發(fā)生變化的情況下,客戶軟件就必須投入大量的人力和財力去研究該宿主軟件的數(shù)據(jù)格式,這是不可取的。
針對空間數(shù)據(jù)存在著來源、尺度、類型、組織方式和軟件支撐平臺的差異性的問題,及對空間數(shù)據(jù)三種集成方式進(jìn)行了討論和對比,本文嘗試將ETL技術(shù)應(yīng)用于空間數(shù)據(jù)集成中,擬設(shè)計出一個主要用于空間數(shù)據(jù)抽取、轉(zhuǎn)換、裝載的工具,旨在將多源異構(gòu)空間數(shù)據(jù)集成為基礎(chǔ)數(shù)據(jù),再通過一鍵抽取功能形成框架數(shù)據(jù)。
(1)系統(tǒng)整體概述
在本系統(tǒng)整個過程中,所操作的數(shù)據(jù)是1∶5萬某市煙草種植項(xiàng)目建設(shè)及規(guī)劃數(shù)據(jù),這些數(shù)據(jù)存儲于專用服務(wù)器上,以O(shè)racle 11g數(shù)據(jù)庫進(jìn)行管理,數(shù)據(jù)格式為ShapeFile(位于地理數(shù)據(jù)庫(Geodatabase)中),存貯這些數(shù)據(jù)的數(shù)據(jù)庫被稱為“源數(shù)據(jù)庫”。系統(tǒng)總體過程可以概括為:
①首先通過連接數(shù)據(jù)庫,訪問到所需要操作的源數(shù)據(jù);
②按照業(yè)務(wù)應(yīng)用的需求,制定抽取規(guī)則,將全部數(shù)據(jù)或通過規(guī)則定義的數(shù)據(jù)抽取到“目標(biāo)數(shù)據(jù)庫”;
③考慮到這些數(shù)據(jù)的保密性因素,需要對所抽取的數(shù)據(jù)進(jìn)行內(nèi)部處理,包括坐標(biāo)變換、涉密過濾、精度降低或平移拉伸等;
④對處理過的數(shù)據(jù)進(jìn)行裝載入庫,形成專題數(shù)據(jù),以供各部門的使用。
(2)技術(shù)方案
主要是對ETL工具的設(shè)計方案的考慮,可以借鑒工作流的一些概念和思路。其系統(tǒng)技術(shù)流程如圖2所示。
圖2 系統(tǒng)技術(shù)流程圖
(3)實(shí)例驗(yàn)證及結(jié)果分析
本實(shí)驗(yàn)的實(shí)例數(shù)據(jù)是某年1∶5萬某市煙草種植項(xiàng)目建設(shè)及規(guī)劃數(shù)據(jù),來源于該市基礎(chǔ)地理信息中心,這些數(shù)據(jù)是按照國家標(biāo)準(zhǔn)1∶5萬矢量數(shù)據(jù)的建庫規(guī)則及各要素分類編碼規(guī)范執(zhí)行。本實(shí)驗(yàn)主要測試了一鍵抽取、查詢抽取及第三方數(shù)據(jù)入庫的功能。
①執(zhí)行一鍵抽取過程
在成功連接數(shù)據(jù)庫后,將數(shù)據(jù)庫中所存儲的空間數(shù)據(jù)讀取出來,通過選取空間數(shù)據(jù),執(zhí)行一鍵抽取的過程,本實(shí)驗(yàn)選取的是6個圖層(點(diǎn)、線和面)要素類進(jìn)行抽取,在執(zhí)行抽取過程中,其詳細(xì)的空間圖形數(shù)據(jù)并不會顯示,整個過程是在后臺中完成的,如圖3所示。對于抽取所得到的結(jié)果將直接入庫,存儲在事先新建好的要素數(shù)據(jù)集(SDE.OFB)中,以系統(tǒng)執(zhí)行該操作的時間來命名。執(zhí)行一鍵抽取前后的數(shù)據(jù)結(jié)果可以通過SDE連接Oracle數(shù)據(jù)庫進(jìn)行查看,分別如圖4和圖5所示。這個過程只能操作數(shù)據(jù)庫中的已存儲的數(shù)據(jù)。
圖3 執(zhí)行一鍵抽取過程
圖5 執(zhí)行一鍵抽取后SDE.OFB數(shù)據(jù)集
圖4 執(zhí)行一鍵抽取前 SDE.OFB 數(shù)據(jù)集
②執(zhí)行查詢抽取過程
為了滿足用戶需求的多樣性,一些用戶并不需要全部的數(shù)據(jù),而只是需要提取其中的部分?jǐn)?shù)據(jù),查詢抽取模塊可以很好解決這一問題。與一鍵抽取模塊相比,查詢抽取過程既能操作數(shù)據(jù)庫中的已存儲的數(shù)據(jù),也可以操作存儲于本機(jī)上的未及時更新到數(shù)據(jù)庫中的數(shù)據(jù)。由于篇幅原因,本文只對前者的數(shù)據(jù)進(jìn)行實(shí)驗(yàn):
連接數(shù)據(jù)庫成功后,獲取數(shù)據(jù)庫中的空間數(shù)據(jù),選擇目標(biāo)數(shù)據(jù)添加至視圖控件中進(jìn)行瀏覽顯示,再選擇圖層,定義篩選條件,最終執(zhí)行查詢。實(shí)驗(yàn)過程中選擇線圖層 LJTB_EST_L_DITCH,篩選條件為“V04_NAMEBASE=‘河南中煙’”。整個執(zhí)行過程及查詢結(jié)果截圖如圖6~圖9所示。
圖6 選擇圖層
圖7 定義篩選條件
圖9 高亮顯示查詢到的結(jié)果
對于根據(jù)定義篩選條件執(zhí)行查詢抽取得到的結(jié)果,可以對其進(jìn)行入庫處理或保存為本地ShapeFile格式文件。為了區(qū)分一鍵抽取得到的數(shù)據(jù),對于查詢抽取得到的數(shù)據(jù)的命名,采用執(zhí)行該操作時的系統(tǒng)時間來命名,如圖10所示。
圖10 執(zhí)行查詢抽取后數(shù)據(jù)集結(jié)果
③第三方數(shù)據(jù)入庫
考慮到數(shù)據(jù)的現(xiàn)勢性問題,有些數(shù)據(jù)并未及時更新到數(shù)據(jù)庫中,因此有了第三方數(shù)據(jù)的存在,為了使這些數(shù)據(jù)能夠入庫并進(jìn)行相關(guān)的操作,本系統(tǒng)專門開發(fā)了這一模塊。為了區(qū)分?jǐn)?shù)據(jù)一鍵抽取和查詢抽取得到的結(jié)果,系統(tǒng)專門另外創(chuàng)建了一個矢量數(shù)據(jù)集并命名為Third,用于存儲第三方的入庫數(shù)據(jù)。入庫后該數(shù)據(jù)在數(shù)據(jù)庫同樣以執(zhí)行該操作時的系統(tǒng)時間進(jìn)行命名。實(shí)例驗(yàn)證過程及結(jié)果如圖11~圖12所示。
圖11 第三方數(shù)據(jù)入庫
圖12 第三方數(shù)據(jù)入庫后結(jié)果
④據(jù)的集成
針對一鍵抽取以及查詢抽取所得到的數(shù)據(jù)和各業(yè)務(wù)部門已有的數(shù)據(jù)進(jìn)行集成。如圖13~圖14所示。
圖13 集成前數(shù)據(jù)顯示
圖14 集成后數(shù)據(jù)顯示
(1)在本系統(tǒng)中只實(shí)現(xiàn)了對ShapeFile格式的矢量數(shù)據(jù)建模、抽取、轉(zhuǎn)換及入庫,對于其他格式的數(shù)據(jù)(如遙感影像數(shù)據(jù)、CAD格式數(shù)據(jù)、MapGIS格式數(shù)據(jù)等)抽取、轉(zhuǎn)換及入庫的開發(fā)工作并未實(shí)現(xiàn),這也正是下一步工作中的主要研究重點(diǎn);
(2)由于實(shí)驗(yàn)環(huán)境和硬件設(shè)備的限制,實(shí)驗(yàn)過程中沒有一臺專門用于存貯數(shù)據(jù)的后臺服務(wù)器,為此,在下一步的工作中有必要增加一臺專用服務(wù)器,用于存儲數(shù)據(jù),以便模擬更真實(shí)的數(shù)據(jù)庫環(huán)境,尤其是在“大數(shù)據(jù)(Big Data)”時代下就更有必要了;
(3)在數(shù)據(jù)轉(zhuǎn)換模塊執(zhí)行數(shù)據(jù)的內(nèi)部處理時,只進(jìn)行了空間數(shù)據(jù)的坐標(biāo)轉(zhuǎn)換,在數(shù)據(jù)的保密性方面未能考慮到位,在后續(xù)的研究與工作中將會繼續(xù)考慮數(shù)據(jù)的脫敏處理,包括數(shù)據(jù)的精度調(diào)整、去噪處理、拉伸平移等;
(4)執(zhí)行數(shù)據(jù)抽取和入庫時的效率(即時間復(fù)雜度)未曾考慮,在今后研究中可以在不同抽取方式下對比其時間復(fù)雜度,探討出效率更優(yōu)、時間更短的抽取方式。
[1] 崔鐵軍.地理信息服務(wù)導(dǎo)論[M].北京:科學(xué)出版社,2009:5~10.
[2]L N yerges T L.Schema integration analysis for the development of GIS databases[J].Int.J.Geographical Information Systems,1989,3(2):153 ~183.
[3]Dan Lee.An ideal means for multiple GIS data transformation and represents[J].Proceedings of the Third Workshop on Geographical Information System,Beijing,1993(1):66 ~79.
[4]Jones C B,Kidner D B,Luo L Q etal.Database design for multi2scale spatial information system[J].Int.J.GeogarPhical Information Systems,1996(10):901 ~920.
[5]李軍,費(fèi)云川.地球空間數(shù)據(jù)集成研究概況[J].地理科學(xué)進(jìn)展,2000,19(3):203 ~211.
[6]宋關(guān)福,鐘耳順,劉紀(jì)遠(yuǎn)等.多源空間數(shù)據(jù)無縫集成研究[J].地理科學(xué)進(jìn)展,2000,19(2):110~115.
[7]鐘耳順,王康弘,宋關(guān)福等.GIS多源數(shù)據(jù)集成模式評述[A].中國 GIS年會(深圳)論文集[C],深圳,1999.
[8] 王雅琴,陶華學(xué),高華等.基于GML的多源異構(gòu)數(shù)據(jù)交換模式研究[J].測繪科學(xué),2006,31(2):88~90.
[9]周順平,魏利萍,萬波等.多源異構(gòu)空間數(shù)據(jù)集成的研究[J].測繪通報,2008(5):25~27.
[10]楊春成,何列松,謝鵬等.基于空間數(shù)據(jù)庫引擎的多源地理空間數(shù)據(jù)管理[J].測繪科學(xué)技術(shù)學(xué)報,2010,27(5):366~370.
[11]李楊,李天文,崔晨等.多源空間數(shù)據(jù)集成技術(shù)綜述與前景展望[J].測繪與空間地理信息,2009,32(1):102~106.
[12]龔瓊宇,李曉,劉棟等.ETL技術(shù)在公共衛(wèi)生數(shù)據(jù)共享中的應(yīng)用研究[J].中國衛(wèi)生工程學(xué),2009,8(1):54 ~56.
[13]繆嘉嘉,鄧蘇,劉青寶.ETL綜述[J].計算機(jī)工程,2004,30(3):4 ~6.
[14]汪立軍.超市數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的研究[J].計算機(jī)與數(shù)字工程,2007,35(9):79 ~82.
[15]代志遠(yuǎn).ETL在電力生產(chǎn)運(yùn)維分析系統(tǒng)中的設(shè)計與實(shí)現(xiàn)[D].青島:山東大學(xué),2009.
[16]王磊.基于ETL的信合數(shù)據(jù)整合模型及解決方案[D].武漢:湖北工業(yè)大學(xué),2011.
[17]尤欣.ETL技術(shù)在商業(yè)智能中的應(yīng)用[J].電腦應(yīng)用技術(shù),2004(74):17~21.
[18]黃裕霞,Cliff Kottman,柯正誼等.可互操作的GIS研究[J].中國圖像圖形學(xué)報,2001,6(9):925~931.
[19]陳楠.多源空間數(shù)據(jù)集成的技術(shù)難點(diǎn)分析和解決策略[J].計算機(jī)應(yīng)用研究,2005(10):206~208.