史小英
(西安航空職業(yè)技術學院,陜西 西安 710089)
礦產(chǎn)資源對我國國民民生和國家經(jīng)濟建設有比較大的影響,礦產(chǎn)作為各行各業(yè)生產(chǎn)必須的能源,對礦產(chǎn)的分布情況進行評估和了解具有重要的意義。隨著現(xiàn)代化科學技術的不斷發(fā)展,可以為地質(zhì)礦產(chǎn)生產(chǎn)提供的數(shù)據(jù)日益增多,為成礦的預測打下了基礎,并提供了相應的數(shù)據(jù)支持。同時也使數(shù)據(jù)的維護難度和管理難度增大,數(shù)據(jù)的獲取難度也隨之增加。人們?yōu)榱丝梢愿玫奶矫鞯V區(qū)的地質(zhì)情況,研發(fā)了各種可以對數(shù)據(jù)進行提取的方法,推進了數(shù)據(jù)挖掘的研究進展。
我國西部地區(qū)某成礦帶在進行成礦預測時,以資源潛力為例開展實驗研究,并將最后得到的預測結(jié)果和傳統(tǒng)分析方法得到的數(shù)據(jù)結(jié)果進行了分析,在利用數(shù)據(jù)理挖掘技術進行分析時,使用ArcSDE作為空間數(shù)據(jù)引擎,本礦區(qū)在進行預測時所使用的數(shù)據(jù)庫系統(tǒng)中包括了礦區(qū)的地球物理數(shù)據(jù)、礦區(qū)的基礎地質(zhì)數(shù)據(jù)、礦區(qū)的地球化學數(shù)據(jù)、礦區(qū)的遙感數(shù)據(jù)等數(shù)據(jù)內(nèi)容。在對數(shù)據(jù)進行計算時,主要采取以ArcEngine組件為基礎的算法進行計算,利用C語言來實現(xiàn)數(shù)據(jù)的挖掘和分析。該礦區(qū)的南北寬度為150 km,東西長度為850 km,總面積大小為9.5萬km2,該礦區(qū)巖性主要包括結(jié)晶灰?guī)r、基性火山巖、片巖、古元古代的金水口巖群、結(jié)晶灰?guī)r、大理巖、斜長角山巖,巖性組合下部采用碎屑巖,上部為中酸性—中基火山巖,新—中元古代萬寶溝群,巖性組合為下部中基性火山巖、上部碳酸鹽巖。出露的漿巖主要為各時代的花崗巖。主要為英云閃長巖、鉀長閃長巖、花崗閃長巖。由于該礦區(qū)出現(xiàn)了多個階段的俯沖情況,礦區(qū)陸緣有增生的情況出現(xiàn),而且?guī)r漿也產(chǎn)生了活動,導致礦區(qū)環(huán)境表現(xiàn)為廣泛化和多樣化的特點。
在建立成礦預測模型和確定需要用到的技術的主要內(nèi)容為:收集大量的地質(zhì)空間數(shù)據(jù)和礦床的模型作為成礦模型的參考依據(jù),從中找出區(qū)域成礦的規(guī)則,找出規(guī)則后還要對其進行驗證,建立一個系統(tǒng)的評價指標來對找出的規(guī)則進行判別,從而為區(qū)域成礦預測模型提供數(shù)據(jù)支撐[1]。在成礦預測模型過程中需要的技術有:連續(xù)型地質(zhì)空間數(shù)據(jù)離散化、成礦空間關系的提取、成礦規(guī)則的提取、系統(tǒng)化的評價。圖1為成礦預測模型框架示意圖。地質(zhì)空間數(shù)據(jù)的空間關系、數(shù)據(jù)的分類、結(jié)構(gòu)化等問題比較復雜,所以為了將這些問題進行總結(jié)歸納,建立一個空間數(shù)據(jù)庫管理系統(tǒng)。將不同的數(shù)據(jù)系統(tǒng)化,將結(jié)構(gòu)化的數(shù)據(jù)和非結(jié)構(gòu)化的數(shù)據(jù)進行系統(tǒng)化的管理,將各數(shù)據(jù)之間建立聯(lián)系。除此之外,空間數(shù)據(jù)庫管理系統(tǒng)還要將管理圖形、遙感影像和 DEM 數(shù)據(jù)收集在內(nèi),并對這些數(shù)據(jù)進行分析研究。數(shù)據(jù)倉庫的主要內(nèi)容是將收集到的數(shù)據(jù)進行加工、分析、分類和儲存,然后將這些數(shù)據(jù)匯總并制作成多維數(shù)據(jù)圖的形式展現(xiàn)出來。收集到的數(shù)據(jù)經(jīng)過數(shù)據(jù)庫的分析后不能直接作為參考依據(jù),還要通過在實際的挖掘過程中進行驗證,驗證符合標準的才能作為參考依據(jù)
圖1 成礦預測模型框架示意圖
在進行地球化學連續(xù)區(qū)間數(shù)據(jù)的收集過程中,收集到的數(shù)據(jù)往往不符合空間數(shù)據(jù)收集的要求,為了解決這一問題,就要對收集到的數(shù)據(jù)進行離散化。傳統(tǒng)的數(shù)據(jù)離散化方法沒有考慮到數(shù)據(jù)的變化性,所以不能準確進行離散化,在本次地質(zhì)空間數(shù)據(jù)收集的過程中采用云模型的離散化方法[2]。采用云模型的方法可以準確計算出變化的地質(zhì)空間數(shù)據(jù),它可以用專業(yè)的數(shù)值和語言來作為轉(zhuǎn)換模型將變化的值轉(zhuǎn)換為確定的數(shù)值,將人類認知中那些模糊和隨機的概念加以系統(tǒng)化的分析,把這些概念構(gòu)成一個映射關系,從而將轉(zhuǎn)換到的數(shù)值運用到數(shù)據(jù)的挖掘和控制當中來。在利用云模型進行地質(zhì)空間數(shù)據(jù)連續(xù)性區(qū)域化學數(shù)據(jù)離散化處理的過程中,首先要對收集到的數(shù)據(jù)進行等級分類 ,然后對收集到的數(shù)據(jù)進行云模型計算,如果計算出的數(shù)值與設計的數(shù)值偏差較大的時候,就要對設計的數(shù)值進行一定的修改。
當判定區(qū)域成礦具備相關條件的時候,還要對相關條件和因素進行空間關系的提取,空間關系包括礦區(qū)斷層的走向、礦層到斷層之間的距離、礦層到不整合界線之間的距離、礦層與斷層、不整合界線三者之間的距離。這些關系可以為成礦的規(guī)則提供重要的參考依據(jù),為研究地質(zhì)空間與成礦空間的關系提供數(shù)據(jù)基礎。
在進行數(shù)據(jù)分析和研究之前,要先參考成礦預測模型中數(shù)值來確定最符合要求的控礦變量及閾值。然后將收集到的數(shù)據(jù)和控礦變量送到相關部門進行檢驗,檢驗通過后要將地層結(jié)構(gòu)的狀況、斷層分布和結(jié)構(gòu)狀況、航磁的數(shù)據(jù)、礦層的分布狀況等影響因素繪制成圖屬性表,作為相關性檢驗的參考依據(jù)。在構(gòu)建地質(zhì)空間研究對象之前,要先將研究的區(qū)域按照1 km×1 km的方式劃分為網(wǎng)格結(jié)構(gòu),然后再利用空間鏈接,將網(wǎng)格結(jié)構(gòu)與制作好的圖層屬性表相對應,從而將每一網(wǎng)格結(jié)構(gòu)的地層結(jié)構(gòu)的狀況、斷層分布和結(jié)構(gòu)狀況、航磁的數(shù)據(jù)、礦層的分布狀況都體現(xiàn)出來。除此之外,為了保證施工的安全性,在進行數(shù)據(jù)處理的時候要將礦層到斷層之間的距離、礦層到不整合界線之間的距離設置緩沖距離,起到保護作用[3]。
根據(jù)地質(zhì)空間的網(wǎng)格特征,現(xiàn)在將每一網(wǎng)格結(jié)構(gòu)的斷層的走向關系和斷層到礦層的距離關系整合在一起,方便成礦的規(guī)則提供參考依據(jù)。為了將它們之間的空間關系更直觀的表現(xiàn)出來,需要利用這些空間關系的數(shù)據(jù)制成圖層屬性表,并將每一網(wǎng)格結(jié)構(gòu)看成是一個地質(zhì)空間對象,把每一個網(wǎng)格結(jié)構(gòu)的相關屬性都表現(xiàn)在圖層屬性表中。然后再分析每一網(wǎng)格結(jié)構(gòu)的圖層屬性表就可以了解該地質(zhì)空間的網(wǎng)格特征了,土層屬性表要表現(xiàn)出該地質(zhì)地層的結(jié)構(gòu)、巖石結(jié)構(gòu)、不整合界線、布格重力的大小、航磁的數(shù)據(jù)、礦層的分布狀況。最后為了計算出具體值,利用云模型的方法對地質(zhì)空間數(shù)據(jù)進行連續(xù)區(qū)間數(shù)據(jù)的離散化挖掘[4]。
除了上文提到的要對收集到的地質(zhì)空間數(shù)據(jù)集進行系統(tǒng)化的管理和相關性的檢驗外,還要對數(shù)據(jù)集進行層次分析和專家評價,專家要根據(jù)評價參數(shù)的重要性將影響參數(shù)重新排列,如表1所示。其中影響最大的是興趣因素,提升度和覆蓋度次之,影響因素最小的是置信度。
表1 計算得到的評價指標權(quán)重分配結(jié)果
結(jié)合以上提取到的成礦關聯(lián)規(guī)則和質(zhì)量評價指標,對成礦地質(zhì)空間數(shù)據(jù)集進行權(quán)重分配,將所研究的地質(zhì)區(qū)域的每個網(wǎng)格結(jié)構(gòu)的值都計算出來。我們就可以跟據(jù)計算出的值將地質(zhì)區(qū)域劃分為不同級別的區(qū)域,如圖2所示,地質(zhì)空間數(shù)據(jù)挖掘的有利成礦區(qū)在高潛力區(qū)和中潛力區(qū)占比大,占總研究值的92%[5]。證據(jù)權(quán)模型有利成礦區(qū)也主要集中在高潛力區(qū)和中潛力區(qū),占總研究值的68%。
圖2 證據(jù)權(quán)模型與地質(zhì)空間數(shù)據(jù)挖掘預測示意
如圖2所示,地質(zhì)空間數(shù)據(jù)挖掘的有利成礦區(qū)域,總礦床點為81個,處于有利成礦區(qū)域的礦床點就達到74個,占總礦床點的92%。此外,在高潛力區(qū)中,處于有利成礦區(qū)域的礦點為58個,占總礦床點的72%,在中潛力區(qū)中,處于有利成礦區(qū)域的礦點為16個,占總礦點的20%。通過以上數(shù)據(jù)我們可以得出基于地質(zhì)空間數(shù)據(jù)挖掘的成礦預測模型的精準度要大大高于傳統(tǒng)的證據(jù)權(quán)模型預測的精準度。
總而言之,在對成礦進行預測時,采用基于數(shù)據(jù)挖掘的預測方法可以對海量的多源地質(zhì)空間數(shù)據(jù)進行充分的利用,通過在礦區(qū)探測中使用數(shù)據(jù)挖掘技術可以有效提升礦區(qū)預測的預測效率和預測精確度,并且可以極大的降低礦區(qū)勘察過程中需要耗費的資金。本案例在對礦區(qū)的成礦情況進行預測時,首先構(gòu)建了以數(shù)據(jù)挖掘技術為基礎的礦區(qū)預測模型,并且提出了具體的預測方法,然后結(jié)合實際案例,對成礦預測效果進行了分析,實踐證明?;跀?shù)據(jù)挖掘的成礦預測精準度更高,具有較高的推廣應用價值。