鄭孝誠,張明華,,任偉
(1.中國地質大學(北京) 地球物理與信息技術學院,北京 100083;2.中國地質調查局 自然資源綜合調查指揮中心,北京 100083)
成礦預測是實現科學找礦、擴大資源儲量的重要途徑和方法[1]。從20世紀中葉開始,關于找礦的相關研究經歷了從定性到定量、再到定位定量預測的發(fā)展階段[2]。1975年,國際地質科學聯合會推出了第一代標準礦產資源定量評價方法,包括區(qū)域價值估計法、體積估計法、豐度估計法、礦床模型法、德爾菲法和綜合法等6種[3],這些方法主要是依靠從業(yè)者的相關經驗來進行應用。但在應用中,因實際地質情況較為復雜,通過第一代標準礦產資源定量評價方法得到的變量太多,導致無法判斷。針對這一問題,地質學者們設想通過減少變量來進行降維,將原有變量通過一些方法轉化為數量更少的新變量。
1993年,由Singer提出的礦產資源的“三步”定量評估方法[4]逐漸成為了當時的主流方法,但該方法在實施過程中有較大的局限性,因為不同的成礦類型可能在相同的地質條件下產生。趙鵬大等[5-6]也提出了“三聯式”資源定量預測與評價。隨著計算機技術的發(fā)展,GIS技術開始應用在地質研究中,地質工作者們利用地質體或者礦體建立找礦模型,通過GIS技術來探究地質體和礦體之間的相互作用關系,從而進行成礦預測[7-8],或是將多重分形原理與成礦過程、礦產資源分布規(guī)律、礦產資源信息獲取研究相結合,以“奇異性—廣義自相似性—分形譜系”為核心進行非線性成礦預測[9]。周永章等[10-11]通過分析大數據和智能礦床模型研究的背景和進展,將機器學習應用到找礦預測中,奠定了大數據智能礦產資源預測與找礦理論的基礎;并將機器學習用在安徽省兆吉口鉛鋅礦床預測的研究中,其預測的45、56號區(qū)域已被證實含礦,證明了卷積神經網絡模型在其研究區(qū)域中已有的數據中是有效的。
為能夠從宏觀上預測山東部分地區(qū)的金礦分布情況,筆者嘗試應用卷積神經網絡這種機器學習方法來對山東部分地區(qū)的金礦分布進行圈定。本研究根據山東省某地金礦成礦區(qū)域的3×104km2范圍內地質、礦產、地球物理、地球化學等實測專業(yè)數據資料進行卷積神經網絡的訓練,建立一套高效的卷積神經網絡,可以有效識別出已知礦床分布的位置,進而將這套卷積神經網絡用于山東省其他未知地區(qū),進行金礦床分布位置(勘查靶區(qū))的預測試驗,得到較好的結果,其大部分已知金礦床勘探區(qū)的分布與網絡輸出的存在金礦床的高概率位置基本重合,驗證了本文卷積神經網絡方法技術的可行性。同時,通過輸入不同數量的專業(yè)數據特征量對網絡輸出結果的影響研究,證實了更多的輸入數據特征量可以明顯提升網絡預測結果的準確率和效率。本研究成果為海量多專業(yè)地質數據與卷積神經網絡相結合進行隱伏礦產資源預測的可行性和有效性研究提供了依據。
通常,在訓練有監(jiān)督的卷積神經網絡模型的時候,會將數據劃分為訓練集、驗證集和測試集,對原始數據進行三個集合的劃分,是為了能夠選出準確率最高的、泛化能力最佳的模型。
訓練集:用來擬合模型,通過設置分類器的參數,訓練分類模型。后續(xù)結合驗證集作用時,會選出同一參數的不同取值,擬合出多個分類器。
驗證集:當通過訓練集訓練出多個模型后,為了能找出效果最佳的模型,使用各個模型對驗證集數據進行預測,并記錄模型準確率。選出效果最佳的模型所對應的參數,即用來調整模型參數。
測試集:通過訓練集和驗證集得出最優(yōu)模型后,使用測試集進行模型預測,用來衡量該最優(yōu)模型的性能和分類能力??梢园褱y試集當做從來不存在的數據集,當已經確定模型參數后,使用測試集進行模型性能評價。
以我國山東半島中西部地區(qū)已知的金礦床資源量和儲量數據以及當地的地質及物探、化探等7組數據作為標簽特征,后增設了與金礦關系密切的5種元素的化探數據再次進行試驗,將實際礦點作為標簽,采用網格單元劃分的方法,進行多專業(yè)數據賦值、網絡學習和預測。圖1為研究區(qū)區(qū)域地質圖。
圖1 研究區(qū)地質概況
首先,將典型金礦點及其周圍區(qū)域根據經緯度劃定測點,將劃定測點上所對應的金礦含量以及12種標簽特征羅列出來,利用計算機算法和程序處理劃分訓練集,并歸納總結出一套適用于該地區(qū)金礦勘查預測的網絡層數和神經元數及屬性參數相對固定的神經網絡。多次測試之后得到某一閾值之下的最佳卷積神經網絡,然后將這套網絡算法應用到其他已知的金礦區(qū)進行預測正確性與準確性的測試。將所得到的卷積神經網絡應用到測試集進行測試,在確定其應用性后,推廣應用到其他類似地區(qū)實際的金礦勘查預測工作中。圖2給出了具體流程。
圖2 研究流程
對于相關特征數據的預處理,由于所選的特征中巖性與地質構造兩種特征無法用數字定義,卷積神經網絡訓練過程中需要識別數字,所以首先要將巖性和地質構造定義為數字(表1)。例如巖性特征,在訓練網絡時是自己定義某種巖性的值,如把某點存在花崗巖,則定義該點的巖性為1,其他的巖性分別定義為2、3、4…,不明地質體定義為0。同理,地質構造也是根據上述條件來進行賦值。
表1 不同巖性和地質構造標簽定義
任意選取訓練集中的一個點,該點經度為122.28°,緯度為37.01°,在地質圖上查詢后得知該點處于上莊斷裂,主要巖性為含礫砂巖—粉砂質黏土,則其對應的巖性和地質構造數據為14、4。
圖3給出了所選訓練集的位置。訓練集取值經度范圍為122.02°~122.51°,緯度范圍為37.02°~37.41°,經緯度以0.01°為間隔進行取點。將圖3中黑色測點的各項特征提取出來整合成訓練集。
圖3 訓練集的點位區(qū)域
選擇該區(qū)域的原因有以下幾點:①訓練集所在區(qū)域的中上部(煙臺市牟平區(qū))有幾個典型的金礦點,區(qū)域內其他位置也存在少數金礦點;②該區(qū)域所掌握的數據比較詳盡,在訓練過程中容易得到好的模型;③該地區(qū)巖性十分豐富,地質構造也十分復雜,有利于訓練網絡的準確性。
為了對不同特征數據條件下訓練出的卷積神經網絡進行比較,選用測點的7種和12種特征數據分別訓練對應的卷積神經網絡。以研究區(qū)已知的金礦床資源量和儲量數據以及當地巖性、磁異常、布格重力異常、自由空氣異常、金異常及地形高程等7組數據作為標簽特征,根據測點的經緯度提取出每個測點所對應的這7種數據,形成一個數據集合,命名為訓練集1;然后增設與金礦關系密切的銀、砷、鉛、鋅和銻的5組元素含量再次進行提取,形成的數據集合命名為訓練集2。
因為所給數據是一維的,不涉及到圖片處理,所以網絡選擇Keras的一維卷積神經網絡。
池化選擇最大池化,因為處理非圖像數據需要用最大池化來減小卷積層參數誤差造成估計均值的偏移。
全連接層激活函數選擇relu激活函數。
線性整流函數(linear rectification function),又稱修正線性單元,對于進入神經元的來自上一層神經網絡的輸入向量,使用線性整流激活函數的神經元會輸出至下一層神經元或作為整個神經網絡的輸出。
輸出層為二分類,選用siqmoid激活函數。
標簽分類的0和1是由測點所在地是否位于實際金礦地而定,位于金礦區(qū)內的點設標簽為1,金礦區(qū)以外區(qū)域的點設標簽為0。
定義損失函數來用于模型參數的估計,在訓練完該卷積神經系統后會得到相應的損失函數。損失函數(loss function)或代價函數(cost function)是將隨機事件或其有關隨機變量的取值映射為非負實數,以表示該隨機事件的“風險”或“損失”的函數。在應用中,損失函數通常作為學習準則與優(yōu)化問題相聯系,即通過最小化損失函數求解和評估模型。當一個模型完美時(雖然不存在),其誤差為0;當模型存在問題時,誤差不管是負值還是正值都偏離0,誤差離0越近說明模型越好。
經過多次訓練的調整,發(fā)現訓練2 000輪的準確率函數與損失函數的結果能夠快速收斂,所以將訓練輪數設定為2 000輪。用上述參數進行訓練后得到了卷積神經網絡。圖4給出了2組訓練集的損失函數與準確率函數。
圖4 訓練后的準確率函數與損失函數
訓練結果表明:
1)該網絡訓練次數越多得到的準確率越高,效果越好。
2)由于所選擇的特征僅有7個,所以準確率僅有76%;增設5組特征重新進行訓練,所得到的準確率函數達到了95%以上,損失函數也在0.1左右。由此說明在卷積神經網絡的訓練中,所選特征數據越多,其準確率會提高。
卷積神經網絡的評價主要是根據準確率函數和損失函數來進行,損失函數越小,準確率越高,則該卷積神經網絡的效果就越好。
首先進行驗證。選擇一塊與網絡訓練使用區(qū)域大小相當的區(qū)域數據來進行驗證,所選區(qū)域經度為121.3°~ 122.0°,緯度為37.0°~37.3°,經緯度均以0.02°為間隔來取點。驗證集點位分布見圖5。驗證集的選取理由有2點:①驗證集區(qū)域和訓練集區(qū)域大小相差不多;②驗證集區(qū)域的巖性和地質構造與訓練集區(qū)域差別不大。
圖5 驗證集點位分布
驗證集一共有577組數據。與提取訓練集類似,將驗證集每個測點的7組和12組特征數據分別提取出來,得到驗證集1和驗證集2,然后將其分別用對應卷積神經網絡進行驗證,得到每個測點對應的標簽與存在金礦的概率。
為了驗證網絡的效果,將輸出結果作等概率圖,通過比較其中的高概率區(qū)是否與實際金礦位置吻合來驗證網絡的準確性(圖6)。
圖6 驗證集的輸出等概率圖
驗證集1中中部呈現高概率的區(qū)域確實有已知金礦的存在,但仍然有已知金礦點處于0.4~0.5的低概率區(qū)域;在0.3~0.4概率區(qū)間也存在一個已知的金礦點。而驗證集2相比于驗證集1的測試結果更為理想,基本所有已知金礦都處于高于0.5的概率區(qū)域。這說明增加與金礦床產出相關的參數(化探元素異常)進行網絡訓練,得出的卷積神經網絡會更好地預測金礦的存在。
驗證集2中仍有少數幾個實際金礦位置出現在預測概率只有0.25~0.5的區(qū)域,這可能是因為驗證集所在的位置巖性不夠復雜,略微單一,選取的特征之一的巖性數據重復較多,同時驗證集的數據量并不多,缺少更為精確詳細的數據;這些因素可能對所得結果產生了消極影響。圖6b中東南部高概率反應區(qū)并沒有金礦存在,卷積神經網絡仍然存在改進的空間。
驗證結束,所得結果較為理想,各項參數不再進行調試,直接應用到測試中。
圖7給出了測試集的選取點位分布。選擇該測試靶區(qū)的理由有以下幾點:①該區(qū)域的巖性不單一,地形構造也多種多樣,能提高所得結果的準確性;②該區(qū)域的已知金礦較多,得到的結果有利于直接用于對比;③該區(qū)域重、磁等資料較豐富,能得到較為準確的原始數據。
圖7 實驗測試集數據選取的點位分布
測點的選擇是根據經緯度來劃分的。選擇經度范圍為120.06°~121.18°,緯度范圍為36.58°~37.50°,均以0.02°為間隔來取點。由于數據缺失和數據重復,所以舍棄了左下角與右下角的部分點位數據的提取。將測點整理成一個數據集,該數據集一共有2 814個測點。與驗證集的提取相同,分別提取出測點的7組和12組特征數據得到測試集1與測試集2,然后將2個測試集分別用對應卷積神經網絡進行測試,得到每個測點對應的標簽與存在金礦的概率,做出等概率圖(圖8)。
圖8 測試集的輸出等概率圖
由圖8可以看出,該網絡的擬合結果良好,大多數金礦點都出現在圖中50%以上的高概率區(qū)域,少數礦點出現在了低概率區(qū)域。東北部的實際金礦點與等概率圖的高概率點基本吻合,得到了較好的結果,剩下的金礦點也基本上處于大于50%的區(qū)域,取得了較為良好的效果。測試集1中南部的高概率點在實地并沒有金礦,這種結果的產生是由于卷積神經網絡訓練時所選用的特征較少,導致其準確率并不是很高。經過增設特征數據后,驗證集南部區(qū)域的高概率反映消失,得到了更為準確的結果。
測試集1中化探異常僅利用了金元素含量,而與金礦關系密切的異常沒有得到充分利用,這可能是導致部分預測結果不很理想的原因。在增設了跟金礦關系密切的相關元素化探數據后,得到了比較符合實際情況的結果,說明了卷積神經網絡應用在金礦勘查方面是可行的。
通過驗證集與測試集的比較,測試集區(qū)域更為符合實際情況。因為測試集的數據幾倍于訓練集的數據,雖然該卷積神經網絡選取的特征較少,但這種差異說明了深度學習在與目標輸出相關的數據種類越多的情況下,所得到的結果就越為準確。因此,在利用卷積神經網絡進行礦產勘查預測中,應盡量多地利用與礦產相關的地質、物化探等多專業(yè)數據來訓練網絡,以達到準確的預測效果。