曹佳敏,盧春陽(yáng)
(浙江省測(cè)繪科學(xué)技術(shù)研究院,浙江杭州 310000)
空間數(shù)據(jù)庫(kù)模型是連接現(xiàn)實(shí)世界與空間實(shí)體的載體,主要是為了描述空間數(shù)據(jù)的組織關(guān)系,以便相關(guān)工作者掌握更多信息[1]。多源地質(zhì)空間數(shù)據(jù)庫(kù)存儲(chǔ)著不同尺度以及不同格式的地質(zhì)數(shù)據(jù),包括地質(zhì)礦產(chǎn)數(shù)據(jù)、地球化學(xué)數(shù)據(jù)以及地球物理數(shù)據(jù)等多源地質(zhì)空間數(shù)據(jù)[2]。美國(guó)、加拿大和英國(guó)等一些經(jīng)濟(jì)較為發(fā)達(dá)的西方國(guó)家對(duì)多源地質(zhì)數(shù)據(jù)庫(kù)的研究起步較早,如美國(guó)地質(zhì)調(diào)查局早在1960年就已經(jīng)開始建設(shè)多源地質(zhì)數(shù)據(jù)庫(kù)。我國(guó)的地質(zhì)資料數(shù)據(jù)庫(kù)建設(shè)始于20世紀(jì)80年代中后期,雖然起步較晚,但在生態(tài)保護(hù)、資源審計(jì)、旅游資源調(diào)查等多個(gè)領(lǐng)域已取得了較大進(jìn)展[3]。根據(jù)相關(guān)研究資料記載,目前對(duì)多源地質(zhì)空間數(shù)據(jù)庫(kù)更新模型與GNSS數(shù)據(jù)相融合的研究還不夠全面,需要進(jìn)一步探討。基于上述背景,本文提出基于GNSS數(shù)據(jù)的多源地質(zhì)空間數(shù)據(jù)庫(kù)更新模型,首先設(shè)定兩個(gè)空間直角坐標(biāo)系,將地質(zhì)空間數(shù)據(jù)進(jìn)行空間坐標(biāo)轉(zhuǎn)換;其次,根據(jù)轉(zhuǎn)換結(jié)果,劃分多源地質(zhì)空間數(shù)據(jù)集,并利用似真函數(shù)、支持函數(shù)與信任函數(shù)之間的關(guān)聯(lián),提取多源地質(zhì)空間數(shù)據(jù)關(guān)聯(lián)規(guī)則,基于GNSS數(shù)據(jù)構(gòu)建數(shù)據(jù)庫(kù)更新模型;最后進(jìn)行該模型的效率分析,驗(yàn)證基于GNSS數(shù)據(jù)的多源地質(zhì)空間數(shù)據(jù)庫(kù)的更新效率。
由于地質(zhì)空間的特殊性,需要進(jìn)行空間內(nèi)坐標(biāo)轉(zhuǎn)換。根據(jù)建立坐標(biāo)系的平行及重合條件,所建立的大地空間直角坐標(biāo)系的各軸之間都是相互平行的關(guān)系[4]。在滿足兩個(gè)坐標(biāo)系只有坐標(biāo)原點(diǎn)不同的前提下,僅通過(guò)平移方式就能完成坐標(biāo)轉(zhuǎn)換[5]。設(shè)定O—ABC與O—A′B′C′為兩個(gè)空間直角坐標(biāo)系,兩坐標(biāo)系各軸之間相互平行,且坐標(biāo)原點(diǎn)不重合。設(shè)定地面上任意一點(diǎn)J,則兩坐標(biāo)的形式表現(xiàn)為:
(1)
式中:p表示的是坐標(biāo)系O—ABC的原點(diǎn)相對(duì)于坐標(biāo)系O—A′B′C′原點(diǎn)的位置矢量,也就是空間內(nèi)的3個(gè)平移轉(zhuǎn)換參數(shù)。選取向量ΔA表示原始坐標(biāo)系的坐標(biāo)點(diǎn)與目標(biāo)坐標(biāo)系的相對(duì)位置向量,設(shè)定AZ、AW分別表示待求點(diǎn)在目標(biāo)坐標(biāo)系和原始坐標(biāo)系的位置向量,如圖1 所示。
圖1 坐標(biāo)轉(zhuǎn)換示意圖Fig.1 Diagram of coordinate transformation
從圖1 可以看出,其坐標(biāo)歐拉角與尺度因子的相對(duì)位置關(guān)系可表示為:
Aw=ΔA+(1+n)S1(SA)S2(SB)S3(SC)AZ
(2)
式中,ΔA表示兩個(gè)坐標(biāo)系之間的相對(duì)位置向量,SA、SB、SC表示坐標(biāo)系的歐拉角,n表示尺度因子。在公式(2)成立的基礎(chǔ)上,則得到用K和L所表示的單位矩陣,根據(jù)兩個(gè)坐標(biāo)系的歐拉角變換關(guān)系,轉(zhuǎn)換公式(2),得到:
Aw=ΔA+AZ+LAZ+nAZ
(3)
在進(jìn)行空間數(shù)據(jù)生產(chǎn)、更新和應(yīng)用時(shí)存在諸多影響因素,涉及空間基準(zhǔn)與數(shù)學(xué)基礎(chǔ)的差異,經(jīng)過(guò)一系列計(jì)算,完成空間坐標(biāo)轉(zhuǎn)換[6]。
多源地質(zhì)空間數(shù)據(jù)庫(kù)是獲取其關(guān)聯(lián)規(guī)則的主要研究對(duì)象,數(shù)據(jù)管理是關(guān)鍵部分[7]。針對(duì)地質(zhì)空間的多源性特點(diǎn),將多源地質(zhì)空間的數(shù)據(jù)集按照數(shù)據(jù)集、要素類、要素集以及要素子集進(jìn)行類型劃分[8]。在多源地質(zhì)空間數(shù)據(jù)庫(kù)中,根據(jù)挖掘任務(wù)提取地質(zhì)空間數(shù)據(jù)挖掘的目標(biāo)數(shù)據(jù)集,縮小處理范圍,提高挖掘效率[9]。在進(jìn)行數(shù)據(jù)處理之前,需要對(duì)目標(biāo)數(shù)據(jù)進(jìn)行限制或者加以條件約束。設(shè)定A={a1,a2,…,am}是項(xiàng)的集合,另設(shè)任務(wù)相關(guān)的數(shù)據(jù)P為數(shù)據(jù)中要素的集合,其中每個(gè)R是項(xiàng)的集合,使R∈A;設(shè)Q是一個(gè)項(xiàng)集,要素集R包含Q,當(dāng)且僅當(dāng)Q∈R。設(shè)定關(guān)聯(lián)規(guī)則Q∈A,其中Q∈A,B∈A,并且Q∩B=?。數(shù)據(jù)關(guān)聯(lián)規(guī)則的評(píng)價(jià)標(biāo)準(zhǔn)主要是支持度與可信度,其中,超過(guò)最低支持度閾值和最低可靠度閾值的規(guī)則稱為強(qiáng)關(guān)聯(lián)規(guī)則。用D(Q)表示數(shù)據(jù)中出現(xiàn)要素Q的概率,D(B/Q)表示地質(zhì)空間D的數(shù)據(jù)中出現(xiàn)要素B的概率,公式表達(dá)如下:
Support(Q→B)=D(Q∪B)Confidence(Q→B)=D(B/Q)
(4)
根據(jù)交易集的要素特征,挖掘空間關(guān)聯(lián)規(guī)則主要就是其支持度與信任度分別大于給定的最小支持度與最小信任度關(guān)聯(lián)度原則[10]。其中,最小支持度表示項(xiàng)目的要素集在數(shù)學(xué)意義上的重要性,最小置信度表示關(guān)聯(lián)規(guī)則的最低可靠性[11]??臻g數(shù)據(jù)庫(kù)與其他數(shù)據(jù)庫(kù)的相同點(diǎn)是:都可以進(jìn)行空間數(shù)據(jù)規(guī)則挖掘,但空間數(shù)據(jù)具有一定的空間特征,因此,需要更深入挖掘。首先,將空間數(shù)據(jù)進(jìn)行組織劃分,用不同的要素表達(dá)不同的數(shù)據(jù)特征[12];其次,根據(jù)數(shù)據(jù)集所包含的空間對(duì)象的條件或者決策屬性,進(jìn)行離散化處理和關(guān)聯(lián)規(guī)則提取,表達(dá)方式如下:
D1∧D2∧…∧Dn→L1∧L2∧…∧Lm(r%,e%)
(5)
式中:r%表示關(guān)聯(lián)規(guī)則的支持度,D1,…,Dn表示空間數(shù)據(jù)的距離要素,e%為關(guān)聯(lián)規(guī)則的置信度,L1,…,Lm表示空間數(shù)據(jù)的方位要素。
這種提取方式適用于多源地質(zhì)空間的多維關(guān)聯(lián)規(guī)則,通過(guò)設(shè)定一種具有逐層搜索的迭代方法,求得空間數(shù)據(jù)的支持函數(shù)和似真函數(shù)與支持函數(shù)在信任函數(shù)上的關(guān)系。設(shè)定一個(gè)非空集合2β,任意命題K在問題域中屬于冪集 ,則其基本概率表示為j2β→[0,1] ,其中,j為基本概率分配函數(shù),并滿足j(?)=0的條件,得出支持函數(shù)的表達(dá)公式為:
(6)
式中:j(K)表示命題K發(fā)生的信任程度,利用空間數(shù)據(jù)的證據(jù)體得到其信任函數(shù)的表達(dá)公式,用Bel(K)表示,即變量對(duì)命題K的支持程度與全部信任程度。似真函數(shù)的表達(dá)公式為:
Wl(K)=1-Bel(Kc) ?K?β
(7)
式中:Wl(K)表示可能屬于命題K的程度。根據(jù)上述公式,得出三者的關(guān)系,如圖2所示。
圖2 信任函數(shù)關(guān)系圖Fig.2 Diagram of trust function
從圖2可以看出,似真函數(shù)和支持函數(shù)與信任函數(shù)之間的關(guān)聯(lián),支持函數(shù)越大就表示獲取該區(qū)域的數(shù)據(jù)關(guān)聯(lián)規(guī)則越容易,反之則越難。至此,完成了多源地質(zhì)空間數(shù)據(jù)關(guān)聯(lián)規(guī)則的獲取。
空間數(shù)據(jù)庫(kù)的更新是將保存的某一時(shí)間點(diǎn)數(shù)據(jù)作為歷史數(shù)據(jù),以變化信息的方式更新數(shù)據(jù)庫(kù)。更新過(guò)程是在原始數(shù)據(jù)庫(kù)中增加實(shí)體的過(guò)程,在保存歷史數(shù)據(jù)、維護(hù)數(shù)據(jù)層關(guān)系以及保證數(shù)據(jù)質(zhì)量的基礎(chǔ)上,進(jìn)行空間數(shù)據(jù)庫(kù)更新模型構(gòu)建[13]。根據(jù)多源數(shù)據(jù)庫(kù)的更新操作對(duì)象不同,多源地質(zhì)空間數(shù)據(jù)更新可分為區(qū)域空間的實(shí)體整體更新與局部更新兩種方式[14]。整體更新主要是采用數(shù)據(jù)集之間疊加的方式;局部更新主要是通過(guò)交互式空間實(shí)體圖形變更來(lái)實(shí)現(xiàn)。二者的區(qū)別是局部更新的操作對(duì)象為單個(gè)實(shí)體,而整體更新的操作對(duì)象為多個(gè)實(shí)體[15]??臻g關(guān)系分析與處理是實(shí)現(xiàn)空間數(shù)據(jù)庫(kù)更新的關(guān)鍵,因此,需要將空間分析技術(shù)作為空間數(shù)據(jù)庫(kù)更新模型的構(gòu)建基礎(chǔ)。同時(shí),還需要考慮實(shí)際情況中的各實(shí)體之間的平面相鄰、平面相離以及空間覆蓋等情況。其中,由于覆蓋情況比較復(fù)雜,需要對(duì)覆蓋區(qū)進(jìn)行具體研究。
設(shè)定線段HM和JM為原線段UP前進(jìn)方向的左右兩條覆蓋區(qū)線段,原線段的起點(diǎn)U和終點(diǎn)P的坐標(biāo)分別為(Ua,Pa)、(Ub,Pb),覆蓋區(qū)半徑為r,則線段UP的左覆蓋區(qū)線段HM的端點(diǎn)坐標(biāo)為(Uc,Pc)、(Ud,Pd),當(dāng)Ub-Ua≠0時(shí),l為線段UP的斜率,其計(jì)算公式如下:
(8)
當(dāng)Pa-Pb>0,l>0或者Pa-Pb<0時(shí),計(jì)算不同線段的斜率,得到線段覆蓋區(qū)斜率,為空間數(shù)據(jù)庫(kù)更新奠定數(shù)據(jù)基礎(chǔ)。多源地質(zhì)空間數(shù)據(jù)庫(kù)的生產(chǎn)與更新主要是對(duì)同一地區(qū)但來(lái)源不同的空間數(shù)據(jù)進(jìn)行有效處理,保證這些數(shù)據(jù)的屬性以及幾何位置層面都有對(duì)應(yīng)的關(guān)系?;谏鲜雒枋雠c計(jì)算,空間數(shù)據(jù)庫(kù)更新模型構(gòu)建完成。
多源地質(zhì)空間數(shù)據(jù)庫(kù)中,通常都需要對(duì)相關(guān)信息進(jìn)行定義與屬性設(shè)置,包括數(shù)據(jù)的生產(chǎn)日期、數(shù)據(jù)名稱等。數(shù)據(jù)屬性越豐富,能提供的信息就越多,數(shù)據(jù)更新的速度就越快。某地質(zhì)空間地層的數(shù)據(jù)屬性如表1所示。
表1 地層屬性結(jié)構(gòu)Tab.1 Stratumattributestructure字段名稱項(xiàng)目允許空字段描述Object-ciNumber(22)not實(shí)體Length-nlNumber3(17)not長(zhǎng)度Name-klNumber1(19)null名字Shape-aqNumber4vnot形狀Perimeter-s1Double-fnull周長(zhǎng)Shape-lenNumber6(e)null長(zhǎng)度Area-3Double-hnull區(qū)域
表1提供的地層屬性結(jié)構(gòu)信息,主要負(fù)責(zé)用戶的數(shù)據(jù)信息查詢以及空間數(shù)據(jù)組織關(guān)系分析。根據(jù)相應(yīng)地質(zhì)礦產(chǎn)數(shù)據(jù)、地球物理數(shù)據(jù)、地球化學(xué)數(shù)據(jù)以及遙感影像數(shù)據(jù)的數(shù)據(jù)集、要素集和要素子集得到多源地質(zhì)空間數(shù)據(jù)組織關(guān)系,如表2所示。
表2 多源地質(zhì)空間數(shù)據(jù)關(guān)系組織Tab.2 Relationshiporganizationofmulti sourcegeospatialdata數(shù)據(jù)集項(xiàng)目數(shù)據(jù)子集數(shù)量要素類數(shù)量地質(zhì)礦產(chǎn)數(shù)據(jù)1∶100000地質(zhì)礦產(chǎn)數(shù)據(jù)e-081212219帶1∶200000地質(zhì)礦產(chǎn)數(shù)據(jù)e-11101311∶150000地質(zhì)礦產(chǎn)數(shù)據(jù)e-041711722帶1∶150000地質(zhì)礦產(chǎn)數(shù)據(jù)e-1391121∶100000地質(zhì)礦產(chǎn)數(shù)據(jù)e-17378地球物理數(shù)據(jù)1∶100000航磁數(shù)據(jù)n-11131∶200000航磁數(shù)據(jù)n-215121∶150000航磁數(shù)據(jù)n-33118地球化學(xué)數(shù)據(jù)1∶100000地球化學(xué)數(shù)據(jù)y-0624231∶100000地球化學(xué)數(shù)據(jù)y-064161∶100000地球化學(xué)數(shù)據(jù)y-0647遙感影像數(shù)據(jù)EYMA數(shù)據(jù)223ASTERI數(shù)據(jù)712HYPEEIOD數(shù)據(jù)3617GIS-8數(shù)據(jù)423
根據(jù)表2可以得出整體性的數(shù)據(jù)庫(kù)更新模型的數(shù)據(jù)組織關(guān)系,應(yīng)用上述信息進(jìn)行模型更新效率測(cè)試。
選取野外調(diào)查、遙感調(diào)查兩種傳統(tǒng)數(shù)據(jù)庫(kù)更新模型,對(duì)此次構(gòu)建的更新模型在不同比例尺地質(zhì)空間的更新速度進(jìn)行測(cè)試,并得出圖3所示測(cè)試結(jié)果。
圖3 數(shù)據(jù)庫(kù)更新速度測(cè)試結(jié)果Fig.3 Results from database updating speed test
根據(jù)圖3的數(shù)據(jù)模型更新速度測(cè)試結(jié)果,得出不同比例尺地質(zhì)空間內(nèi)3種更新模型的更新速度均值,如表3所示。
表3 三種模型更新速度均值Tab.3 Averageupdatingspeedofthethreemodels比例尺傳統(tǒng)更新模型1/s傳統(tǒng)更新模型2/s基于GNSS數(shù)據(jù)的更新模型/s1∶500000.31600.38230.19871∶1000005.26434.40173.31591∶20000042.114737.480627.4401
從表3可知,基于GNSS數(shù)據(jù)所構(gòu)建的數(shù)據(jù)庫(kù)更新模型在三種不同的比例尺地質(zhì)空間的更新速度均高于兩種傳統(tǒng)數(shù)據(jù)庫(kù)更新模型的速度。當(dāng)比例尺為1∶50 000時(shí),基于GNSS數(shù)據(jù)的更新模型比傳統(tǒng)模型1高于0.117 3 s,比傳統(tǒng)模型2高于0.183 6 s;當(dāng)比例尺為1∶100 000時(shí),基于GNSS數(shù)據(jù)的更新模型比傳統(tǒng)模型1高于1.948 4 s,比傳統(tǒng)模型2高于1.085 8 s;當(dāng)比例尺為1∶200 000時(shí),基于GNSS數(shù)據(jù)的更新模型比傳統(tǒng)模型1高于14.674 6 s,比傳統(tǒng)模型2高10.040 5 s。由上述內(nèi)容可知,融合了GNSS數(shù)據(jù)的數(shù)據(jù)庫(kù)更新模型的更新效率更高。
根據(jù)實(shí)驗(yàn)測(cè)試結(jié)果可知,本研究設(shè)計(jì)的數(shù)據(jù)庫(kù)更新模型的數(shù)據(jù)更新速度快,更適用于研究多源地質(zhì)空間數(shù)據(jù)庫(kù)更新。其結(jié)果在一定程度上推動(dòng)了數(shù)據(jù)庫(kù)更新領(lǐng)域的發(fā)展,同時(shí)為學(xué)術(shù)界開展相關(guān)研究奠定了理論和實(shí)踐基礎(chǔ)。但是,由于研究條件有限,多源地質(zhì)空間數(shù)據(jù)庫(kù)更新模型的精度還有待研究,未來(lái)需要進(jìn)一步探討與完善模型精度。