亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SMOTified-BRF模型的地球化學(xué)金礦化異常預(yù)測(cè)研究

        2025-02-19 00:00:00徐正林王晰薛林福冉祥金燕群李永勝于曉飛
        黃金 2025年1期
        關(guān)鍵詞:模型研究

        摘要:礦產(chǎn)勘查既是新質(zhì)生產(chǎn)力的重要組成,又是推動(dòng)新質(zhì)生產(chǎn)力發(fā)展的重要力量。為了改善礦產(chǎn)勘查中金礦化預(yù)測(cè)面臨的由于已知礦化樣本數(shù)量少導(dǎo)致的樣本類不平衡問(wèn)題及礦化信息稀缺問(wèn)題,提出SMOTified-BRF模型,該模型使用SMOTE方法對(duì)極少數(shù)已知礦化樣本進(jìn)行數(shù)量增強(qiáng)并使用平衡隨機(jī)森林方法進(jìn)行預(yù)測(cè)。以漢濱—旬陽(yáng)地區(qū)為研究區(qū),對(duì)水系沉積物地球化學(xué)數(shù)據(jù)分別使用SMOTified-BRF模型和BRF模型進(jìn)行金礦化預(yù)測(cè)效果和模型性能對(duì)比研究。研究結(jié)果表明:SMOTified-BRF模型的AUC值(0.9875)高于BRF模型的AUC值(0.9726),且在約登指數(shù)指示的最優(yōu)閾值下SMOTified-BRF模型預(yù)測(cè)的礦化面積占比(1.95%)相較于BRF模型(12.23%)更小,說(shuō)明SMOTified-BRF模型相比于BRF模型具有更準(zhǔn)確高效的金礦化異常預(yù)測(cè)性能。

        關(guān)鍵詞:金礦化;異常;預(yù)測(cè);平衡隨機(jī)森林法;SMOTE;地球化學(xué);漢濱—旬陽(yáng)地區(qū)

        中圖分類號(hào):TD11 P618.51文章編號(hào):1001-1277(2025)01-0011-09

        文獻(xiàn)標(biāo)志碼:A doi:10.11792/hj20250103

        2023年9月,習(xí)近平總書(shū)記在主持召開(kāi)新時(shí)代推動(dòng)?xùn)|北全面振興座談會(huì)時(shí)提出,積極培育戰(zhàn)略性新興產(chǎn)業(yè)和未來(lái)產(chǎn)業(yè),加快形成新質(zhì)生產(chǎn)力,增強(qiáng)發(fā)展新動(dòng)能。礦產(chǎn)勘查處于礦產(chǎn)資源產(chǎn)業(yè)鏈供應(yīng)鏈的最前端,關(guān)系到現(xiàn)代化產(chǎn)業(yè)體系發(fā)展的能量與物質(zhì)基礎(chǔ),在發(fā)展新質(zhì)生產(chǎn)力中具有重要的基礎(chǔ)地位和支撐作用。礦產(chǎn)勘查通過(guò)發(fā)現(xiàn)和查明礦產(chǎn)資源,既為現(xiàn)代產(chǎn)業(yè)體系構(gòu)建提供物質(zhì)基礎(chǔ),又是現(xiàn)代產(chǎn)業(yè)體系的一部分,自身生產(chǎn)力的提升也是發(fā)展新質(zhì)生產(chǎn)力的重要內(nèi)容,對(duì)于保障資源安全,增強(qiáng)發(fā)展新動(dòng)能具有重要意義3。作為礦業(yè)行業(yè)新質(zhì)生產(chǎn)力的重要組成,人工智能找礦方興未艾。

        地球化學(xué)數(shù)據(jù)是一類重要的找礦信息,在礦產(chǎn)勘查與評(píng)價(jià)中具有非常關(guān)鍵的作用?;诘厍蚧瘜W(xué)數(shù)據(jù)處理的人工智能方法研究一直是地球化學(xué)研究領(lǐng)域的熱門(mén)方向之一。使用先進(jìn)的方法從大量地球化學(xué)數(shù)據(jù)中挖掘礦致信息并進(jìn)行礦化預(yù)測(cè),有助于推動(dòng)礦產(chǎn)勘查發(fā)展。

        成礦系統(tǒng)的復(fù)雜性及成礦作用的多期多階段特征導(dǎo)致地球化學(xué)數(shù)據(jù)往往具有復(fù)雜、未知的空間與頻率分布特征。近年來(lái),由于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)方法在處理具有復(fù)雜分布特性非線性數(shù)據(jù)的分類與回歸預(yù)測(cè)問(wèn)題中具有良好表現(xiàn)”,越來(lái)越多的學(xué)者將先進(jìn)的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)方法引入地球化學(xué)礦化預(yù)測(cè)領(lǐng)域,如支持向量機(jī)、隨機(jī)森林、受限玻爾茲曼機(jī)等。然而,地球化學(xué)數(shù)據(jù)中的已知礦化樣本(陽(yáng)性樣本)數(shù)量稀缺背景樣本(性樣本)數(shù)量占比大,使用一般的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法對(duì)類不平衡的地球化學(xué)數(shù)據(jù)進(jìn)行礦化預(yù)測(cè)面臨著挑戰(zhàn)。已有學(xué)者將關(guān)注點(diǎn)放在解決地球化學(xué)數(shù)據(jù)類別、數(shù)量不平衡問(wèn)題的方法研究上,此類研究包括從數(shù)據(jù)處理角度引進(jìn)各類采樣方法平衡數(shù)據(jù)類別比例和從算法角度引進(jìn)類不平衡學(xué)習(xí)集成算法進(jìn)行數(shù)據(jù)的分類任務(wù)處理。例如,SHAYILAN等利用合成少數(shù)類過(guò)采樣技術(shù)進(jìn)行過(guò)采樣以平衡數(shù)據(jù)類別比例,CHEN等引入自定步集成框架來(lái)處理類不平衡問(wèn)題。

        考慮到已有模型大多單獨(dú)關(guān)注從數(shù)據(jù)或者算法角度解決樣本類不平衡的問(wèn)題,因此本研究同時(shí)從數(shù)據(jù)處理角度和算法角度出發(fā),結(jié)合合成少數(shù)類過(guò)采樣技術(shù)(Synthetic Minority Oversampling Technique, SMOTE)和平衡隨機(jī)森林算法(Balanced Random Forest,BRF),提出采用SMOTified-BRF模型進(jìn)行 類不平衡地球化學(xué)數(shù)據(jù)的礦化預(yù)測(cè)研究。平衡隨機(jī)森林算法是一種類不平衡學(xué)習(xí)集成算法,它在隨機(jī)森林算法(Random Forest,RF)的基礎(chǔ)上引進(jìn)了隨機(jī)欠采樣策略[20]。平衡隨機(jī)森林算法在訓(xùn)練每棵決策樹(shù)(Decision Tree,DT)之前通過(guò)對(duì)數(shù)量占多數(shù)的類別數(shù)據(jù)進(jìn)行隨機(jī)欠采樣,以此來(lái)平衡用于訓(xùn)練每棵決策樹(shù)的訓(xùn)練子集類別比例。平衡隨機(jī)森林算法建立在傳統(tǒng)隨機(jī)森林算法的基礎(chǔ)上,使用多棵決策樹(shù)的集成來(lái)提高預(yù)測(cè)的準(zhǔn)確性和穩(wěn)定性。平衡隨機(jī)森林算法不僅具有隨機(jī)森林算法的準(zhǔn)確率高、善于處理離散數(shù)據(jù)等優(yōu)點(diǎn)[2],同時(shí)更善于處理類不平衡數(shù)據(jù)。平衡隨機(jī)森林算法適合用于類不平衡地球化學(xué)數(shù)據(jù)的異常識(shí)別與分類。然而,在已知礦化樣本極度稀缺的地球化學(xué)數(shù)據(jù)中,平衡隨機(jī)森林算法在訓(xùn)練每棵決策樹(shù)前為了構(gòu)建類別平衡的訓(xùn)練子集,會(huì)隨機(jī)剔除過(guò)多的背景樣本,導(dǎo)致丟失具有重要信息的背景樣本。同時(shí),已知礦化樣本的稀缺容易導(dǎo)致決策樹(shù)在學(xué)習(xí)已知礦化樣本特征的過(guò)程中出現(xiàn)過(guò)擬合問(wèn)題。因此,本研究引進(jìn)SMOTE,對(duì)地球化學(xué)數(shù)據(jù)中的已知礦化樣本進(jìn)行數(shù)量增強(qiáng),并使用增強(qiáng)后的地球化學(xué)數(shù)據(jù)作為平衡隨機(jī)森林算法的訓(xùn)練集,構(gòu)建基于SMOTE增強(qiáng)的平衡隨機(jī)森林金礦化預(yù)測(cè)模型(SMOTified-BRF模型)。

        本研究以漢濱—旬陽(yáng)地區(qū)作為研究區(qū),對(duì)1:5萬(wàn)水系沉積物地球化學(xué)數(shù)據(jù)分別構(gòu)建SMOTified-BRF模型和BRF模型進(jìn)行金礦化預(yù)測(cè)和對(duì)比研究。研究結(jié)果證明,SMOTified-BRF模型預(yù)測(cè)的金礦化區(qū)比BRF模型預(yù)測(cè)的金礦化區(qū)具有更小的范圍和更高的準(zhǔn)確性。

        1地質(zhì)概況

        漢濱—旬陽(yáng)地區(qū)位于陜西省安康市(見(jiàn)圖1-C),大地構(gòu)造位置位于秦嶺地塊南緣,屬揚(yáng)子板塊(Ⅲ)秦嶺—大別山新元古代—中生代造山帶(Ⅲ?)北大巴山—西傾山早古生代裂谷帶(Ⅲ2)舟曲—安康早古生代裂谷帶(Ⅲ2-1)(見(jiàn)圖1-B)。研究區(qū)主要發(fā)育斷裂有北西向展布脆性斷裂,近南北向次級(jí)小型脆性斷裂及北西向脆韌性剪切帶,由北向南劃分為趙家山—斜山寨滑脫逆沖推覆體、將軍山—爛木溝滑脫逆沖推覆體和安康斷陷盆地3個(gè)次級(jí)構(gòu)造單元。研究區(qū)出露地層有寒武系魯家坪巖組(Z?-E?l)、箭竹壩組(Z?-E?j),奧陶系洞河巖組(Odh),奧陶系—志留系斑鳩關(guān)巖組(O?-S?b),志留系梅子埡巖組(S?-2m),泥盆系大楓溝組(D?d)、古道嶺組(D?-3g)、星紅鋪組(D?x),以及第四系(Q)等(見(jiàn)圖1-A)[22]。研究區(qū)內(nèi)火山巖建造不發(fā)育,僅在圖幅中部神灘河—爛木溝一帶魯家坪巖組中有少量出露;侵入巖極不發(fā)育,未見(jiàn)巖體出露,僅見(jiàn)酸性巖脈出露[23]。研究區(qū)主體為變質(zhì)巖建造區(qū),占70%以上,氣-液變質(zhì)巖不可見(jiàn),熱接觸變質(zhì)巖極不發(fā)育,變質(zhì)巖主要為區(qū)域變質(zhì)巖和動(dòng)力變質(zhì)巖。

        研究區(qū)共發(fā)現(xiàn)典型金礦床(點(diǎn))5處(見(jiàn)表1),成因類型均為韌性剪切帶型,主要分布于區(qū)域性韌性剪切帶兩側(cè)的次級(jí)構(gòu)造帶中。區(qū)域內(nèi)金礦床(點(diǎn))主要分布于斑鳩關(guān)巖組、洞河巖組、梅子埡巖組、魯家坪巖組地層中。含礦巖性主要為含碳黑云母絹云母石英片巖、絹云石英片巖、硅質(zhì)板巖、碳質(zhì)板巖等。研究區(qū)內(nèi)與金成礦關(guān)系密切的蝕變主要有硅化、絹云母化、黃鐵礦化等,表現(xiàn)為蝕變?cè)綇?qiáng),規(guī)模越大[24]。

        2地球化學(xué)數(shù)據(jù)預(yù)處理與指示元素選擇

        研究區(qū)的地球化學(xué)數(shù)據(jù)來(lái)源于安康幅1:5萬(wàn)水系沉積物調(diào)查樣本,樣本數(shù)量為1828件。對(duì)樣本測(cè)試了14種元素,分別為Au、Ag、As、Bi、Cd、Co、Cr、Hg、Mo、Pb、Zn、W、Sn、Ni。對(duì)1828件水系沉積物樣本的14種元素?cái)?shù)據(jù)進(jìn)行網(wǎng)格化處理,為每種元素生成379×476(180404)個(gè)網(wǎng)格數(shù)據(jù)。

        許多元素在空間的濃度分布與特定類型的礦化相關(guān),其有助于指導(dǎo)地質(zhì)專家發(fā)現(xiàn)特定類型礦床[25]。本研究旨在通過(guò)分析研究區(qū)與金礦化相關(guān)的地球化學(xué)數(shù)據(jù)來(lái)指導(dǎo)金礦勘查?;谇叭搜芯拷Y(jié)果,本文使用ROC(Receiver Operating Characteristic)曲線來(lái)評(píng)價(jià)研究區(qū)地球化學(xué)模式與已知金礦床(點(diǎn))位置之間的空間相關(guān)性[26-28]。結(jié)合ROC曲線下面積(AUC)和對(duì)應(yīng)的滿足標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量值(ZAuc)選擇指示研究區(qū)金礦化的元素[14-17]?;?4種元素的濃度值及已知礦化點(diǎn)的對(duì)應(yīng)組成元素濃度繪制了ROC曲線,結(jié)果見(jiàn)圖2;計(jì)算了14種元素AUC值和ZAuc值,結(jié)果見(jiàn)表2。由圖2可知,Au、Co、Ni、Pb和Zn 5種元素的ROC曲線更加接近ROC空間的左上角,表明該5種元素的濃度分布模式與已知金礦床(點(diǎn))的位置分布具有較強(qiáng)的空間相關(guān)性。由表2可知,Au、Co、Ni、Pb和Zn5種元素的AUC值和ZAuc值分別大于0.5和1.96。因此,就AUC值和Zuc值而言,這5種元素與成礦具有正相關(guān)關(guān)系[25]。本研究選擇Au、Co、Ni、Pb和Zn5種元素作為指示研究區(qū)金礦化的地球化學(xué)元素。

        所選5種指示元素的濃度等值線圖見(jiàn)圖3。由圖3可知,除Au分布較為零散外,剩余4種元素大體呈北西向分布,與韌性剪切帶展布方向一致,這5種元素的濃度分布與5個(gè)已知金礦床(點(diǎn))的分布有較強(qiáng)的空間相關(guān)性。

        3基本算法

        3.1 SMOTE算法

        SMOTE算法是由CHAWLA等[18]提出的一種過(guò)采樣方法,旨在通過(guò)數(shù)量增強(qiáng)來(lái)解決數(shù)據(jù)的類不平衡問(wèn)題。該算法受K近鄰算法啟發(fā),核心思想是對(duì)每個(gè)少數(shù)類樣本,在特征空間中使用歐幾里得距離來(lái)確定其k個(gè)最近的同類樣本。對(duì)于選定的少數(shù)類樣本及其近鄰樣本,SMOTE算法通過(guò)在它們之間的連線上進(jìn)行隨機(jī)插值來(lái)合成新的少數(shù)類樣本。具體而言,對(duì)于每個(gè)少數(shù)類樣本x;∈R?,首先確定其在同類樣本中的k個(gè)近鄰樣本,然后從這k個(gè)近鄰樣本中隨機(jī)選擇1個(gè)樣本(x,,=1,2,3,…,k)。在樣本x?與x,連接的線段上隨機(jī)插值生成1個(gè)新的樣本點(diǎn)xnw。其中,x:,為少數(shù)類樣本x,的第p個(gè)屬性值,x,p為近鄰樣本x.的第p個(gè)特征值,p=1,2,3,…,d。新樣本xne的第p個(gè)特征可通過(guò)式(1)計(jì)算得出:

        式中:λ為介于0和1之間的隨機(jī)數(shù)。

        通過(guò)上述方法,SMOTE算法創(chuàng)造性地引入新的信息點(diǎn),增強(qiáng)了數(shù)據(jù)集中少數(shù)類樣本的表達(dá)。SMOTE算法在特征空間合成少數(shù)類樣本的過(guò)程見(jiàn)圖4。

        3.2 BRF算法

        BRF算法是由YOUSRA等[19]提出的一種為了解決訓(xùn)練數(shù)據(jù)中類不平衡問(wèn)題而設(shè)計(jì)的改進(jìn)RF算法。該算法基于bagging算法的集成思想,同時(shí)迭代訓(xùn)練多棵相互獨(dú)立的決策樹(shù)(CART)弱分類器,然后使用訓(xùn)練過(guò)的每棵決策樹(shù)對(duì)測(cè)試集數(shù)據(jù)進(jìn)行分類預(yù)測(cè)并對(duì)預(yù)測(cè)結(jié)果通過(guò)投票或求平均值的方式進(jìn)行集成。

        在二分類問(wèn)題中,通常將少數(shù)類樣本設(shè)定為陽(yáng)性樣本,將多數(shù)類樣本設(shè)定為陰性樣本。針對(duì)二分類問(wèn)題,給定訓(xùn)練樣本集D=(x?,y?),(x?,y?),(x3,y3),…,(xn,yn)。其中,y,為樣本x,的類標(biāo)簽(i=1,2,3,…,n),取0或1(0代表陰性樣本,1代表陽(yáng)性樣本),樣本集D中陽(yáng)性樣本數(shù)量為m;測(cè)試集U={x?,x?,x3,…,x。;決策樹(shù)弱分類器迭代次數(shù)T,BRF算法的步驟為:

        1)對(duì)于第t(t=1,2,3,…,T)棵決策樹(shù)而言,①?gòu)挠?xùn)練集的陽(yáng)性樣本中隨機(jī)有放回地抽取m個(gè)引導(dǎo)(bootstrap)樣本,同時(shí)基于隨機(jī)欠采樣的策略從多數(shù)類樣本中隨機(jī)有放回地抽取相同數(shù)量的樣本;②將抽取相同數(shù)量的2類樣本組合成一個(gè)類平衡的訓(xùn)練子集D,;③從訓(xùn)練子集D,中誘導(dǎo)1棵決策樹(shù)f,,使其達(dá)到指定的最大生長(zhǎng)深度,不進(jìn)行剪枝。

        2)將步驟(1)重復(fù)多次,直到訓(xùn)練出指定數(shù)量(T)的決策樹(shù)弱分類器。

        3)使用T棵訓(xùn)練過(guò)的決策樹(shù)對(duì)測(cè)試集數(shù)據(jù)U進(jìn)行分類預(yù)測(cè),令f,(x;)表示第t棵決策樹(shù)f,預(yù)測(cè)樣本x;(i=1,2,3,…,c)為陽(yáng)性的概率。

        4)對(duì)T棵決策樹(shù)的預(yù)測(cè)結(jié)果通過(guò)求平均值得到最終預(yù)測(cè)結(jié)果。其中,T棵決策樹(shù)對(duì)測(cè)試樣本x;(i=1,2,3,…,c)為陽(yáng)性樣本的概率預(yù)測(cè)結(jié)果表示為:

        (2)

        上述決策樹(shù)基于CART算法構(gòu)建,但進(jìn)行了部分修改,即在每個(gè)節(jié)點(diǎn)上不再搜索所有特征變量以獲得最佳分割點(diǎn),而是隨機(jī)選取部分特征變量進(jìn)行搜索,有助于增加決策樹(shù)模型的多樣性。BRF算法流程見(jiàn)圖5。

        4金礦化預(yù)測(cè)

        4.1 SMOTified-BRF模型與BRF模型

        為了解決樣本中存在的類比平衡問(wèn)題,首先,使用SMOTE技術(shù)對(duì)研究區(qū)地球化學(xué)數(shù)據(jù)中的5個(gè)金礦床(點(diǎn))樣本進(jìn)行過(guò)采樣,通過(guò)生成一定數(shù)量的合成礦化樣本,增加了原始地球化學(xué)數(shù)據(jù)集中的已知金礦化樣本數(shù)量。其次,將包含合成礦化樣本的地球化學(xué)數(shù)據(jù)集作為BRF算法的訓(xùn)練集,構(gòu)建了SMOTified-BRF模型。模型的參數(shù)設(shè)置對(duì)于模型的最終性能具有決定性作用,本研究以模型正確預(yù)測(cè)已知金礦床(點(diǎn))的能力作為參數(shù)優(yōu)化指標(biāo),使用GridSearchCV進(jìn)行參數(shù)優(yōu)化。SMOTified-BRF模型的參數(shù)設(shè)置見(jiàn)表3。訓(xùn)練結(jié)束后,將研究區(qū)所有樣本作為測(cè)試數(shù)據(jù),使用SMOTified-BRF模型對(duì)測(cè)試數(shù)據(jù)進(jìn)行類別預(yù)測(cè)。SMOTified-BRF模型輸出的是一個(gè)向量,表示測(cè)試樣本屬于背景樣本的概率與金礦床(點(diǎn))樣本的概率,2類樣本的預(yù)測(cè)概率和為1。同時(shí),使用BRF算法對(duì)研究區(qū)原始地球化學(xué)數(shù)據(jù)進(jìn)行建模,構(gòu)建BRF模型,參數(shù)設(shè)置與SMOTified-BRF模型的BRF分類器相同。BRF模型輸出的是一個(gè)向量,表示測(cè)試樣本屬于背景樣本的概率與金礦床(點(diǎn))樣本的概率,2類樣本的預(yù)測(cè)概率和為1。

        本研究基于SMOTified-BRF模型和BRF模型對(duì)研究區(qū)地球化學(xué)數(shù)據(jù)進(jìn)行預(yù)測(cè),這2個(gè)模型的性能評(píng)估指標(biāo)值見(jiàn)表4。

        4.2模型性能評(píng)估

        ROC常用于評(píng)估二分類器的分類性能,已被用于地球化學(xué)礦化預(yù)測(cè)模型的性能評(píng)估[15,17,29]。本研究繪制了SMOTified-BRF模型和BRF模型的ROC曲線(見(jiàn)圖6)并計(jì)算了對(duì)應(yīng)的AUC值和ZAvc值(見(jiàn)表4)。由圖6可知,SMOTified-BRF模型的ROC曲線更接近ROC空間的左上角。由表4可知,SMOTi-fied-BRF模型的AUC值為0.9875,高于BRF模型的AUC值(0.9726)。同時(shí),SMOTified-BRF模型(ZAuc=13.8914)和BRF模型(ZAuc=9.2232)的ZAuc值均高于1.96,說(shuō)明在0.05的顯著性水平下,SMOTified-BRF模型和BRF模型的分類性能顯著高于隨機(jī)猜測(cè)模型。

        4.3礦化區(qū)圈定

        本文引進(jìn)約登指數(shù)(Youden Index,YI)圈定模型預(yù)測(cè)最優(yōu)閾值下的研究區(qū)金礦化情況[15,29]。約登指數(shù)是一種適用于選擇最佳分類閾值的統(tǒng)計(jì)度量,YI為真陽(yáng)性率減去假陽(yáng)性率。在本文中,真陽(yáng)性率是指所有已知金礦化樣本中被模型正確預(yù)測(cè)出來(lái)的已知金礦化樣本的比例,假陽(yáng)性率是指背景樣本中被模型預(yù)測(cè)為已知金礦化樣本的比例。約登指數(shù)取值為0~1,約登指數(shù)值越大,代表模型的分類性能越好。最大約登指數(shù)對(duì)應(yīng)的閾值被確定為劃分預(yù)測(cè)礦化區(qū)的最優(yōu)閾值,結(jié)果見(jiàn)圖7。由圖7可知,SMOTified-BRF模型的最大約登指數(shù)為0.9806,其對(duì)應(yīng)的最優(yōu)閾值為0.8136;BRF模型的最大約登指數(shù)為0.8777,其對(duì)應(yīng)的最優(yōu)閾值為0.6782。

        SMOTified-BRF模型和BRF模型預(yù)測(cè)的金礦化概率分布見(jiàn)圖8?;趫D7中最高約登指數(shù)對(duì)應(yīng)的最優(yōu)閾值,在圖8-a中圈定了金礦化概率大于0.8136的礦化區(qū),在圖8-b中圈定了金礦化概率大于0.6782的礦化區(qū)。礦化區(qū)呈北西向分布,且與已知金礦床(點(diǎn))的空間分布一致。通過(guò)對(duì)比圖8-a和圖8-b可以發(fā)現(xiàn),礦化區(qū)覆蓋了5個(gè)已知金礦床(點(diǎn))。從圈定面積來(lái)看,圖8-a圈定的礦化面積占研究區(qū)總面積的1.95%,小于圖8-b的12.23%。

        同時(shí),為避免由于選取不同最優(yōu)閾值導(dǎo)致的圈定面積差異問(wèn)題,選取SMOTified-BRF模型的最優(yōu)閾值0.8136同時(shí)作為BRF模型的高礦化概率邊界值,預(yù)測(cè)的礦化概率不小于0.8136的金礦化區(qū)分布見(jiàn)圖9。由圖9可知:SMOTified-BRF模型圈定的礦化區(qū)覆蓋了5個(gè)已知金礦床(點(diǎn)),BRF模型圈定的礦化區(qū)僅覆蓋了4個(gè)已知金礦床(點(diǎn));在準(zhǔn)確性存在差異的情況下,SMOTified-BRF模型圈定的礦化區(qū)面積占比(1.9 5%)仍小于BRF模型中圈定的面積占比(3.96%)。由此可見(jiàn),SMOTified-BRF模型具有更準(zhǔn)確的金礦化相關(guān)地球化學(xué)金礦化預(yù)測(cè)性能。

        從圈定區(qū)域的合理性考慮,圖8-a圈定的礦化范圍覆蓋地層為斑鳩關(guān)巖組、洞河巖組、梅子埡巖組;圖8-b圈定的礦化范圍覆蓋地層為斑鳩關(guān)巖組、洞河巖組、梅子埡巖組、魯家坪巖組;圖9-b圈定的礦化范圍覆蓋的地層為斑鳩關(guān)巖組、洞河巖組、梅子埡巖組、魯家坪巖組。從圈定地層與含礦地層情況對(duì)比可知,SMOTified-BRF模型和BRF模型所圈定的金礦化預(yù)測(cè)結(jié)果與含礦地層吻合程度較好;從圈定區(qū)域與構(gòu)造的對(duì)比情況來(lái)看,SMOTified-BRF模型和BRF模型圈定的礦化區(qū)整體上沿北西向分布,與韌性剪切帶分布一致。以上結(jié)果證明,圈定的金礦化預(yù)測(cè)區(qū)具有一定的可靠性。

        以SMOTified-BRF模型圈定的金礦化預(yù)測(cè)區(qū)中(見(jiàn)圖8-a),除原有金礦床(點(diǎn))外,另圈定出3處不含已知金礦床(點(diǎn))的找礦遠(yuǎn)景區(qū),分別為P1、P2與P3。

        找礦遠(yuǎn)景區(qū)P1所處地層為斑鳩關(guān)巖組、洞河巖組和魯家坪巖組,巖性主要為黑色碳質(zhì)板巖、黑色板巖、絹云石英片巖等,在空間分布上大體沿韌性剪切帶分布,且靠近1處石英脈強(qiáng)變形疊加強(qiáng)硅化區(qū)界線;找礦遠(yuǎn)景區(qū)P2所處地層為魯家坪巖組和洞河巖組,巖性主要為絹云石英片巖、黑色板巖等,在空間分布上大體沿韌性剪切帶分布,且靠近1處石英脈強(qiáng)變形疊加強(qiáng)硅化區(qū)界線;找礦遠(yuǎn)景區(qū)P3所處地層為魯家坪巖組和洞河巖組,巖性主要為絹云石英片巖、黑色板巖等,在空間分布上,沿韌性剪切帶分布,且靠近2處石英脈強(qiáng)變形疊加強(qiáng)硅化區(qū)界線。

        通過(guò)對(duì)比地層、巖性、分布及蝕變等情況,圈定的3處找礦遠(yuǎn)景區(qū)具有較好的合理性,可以作為下一步找礦依據(jù)。

        5結(jié)論

        1)SMOTified-BRF模型與BRF模型地球化學(xué)金礦化預(yù)測(cè)均能取得較好效果,且預(yù)測(cè)金礦化區(qū)的地層情況與含礦地層一致,分布區(qū)域與韌性剪切帶吻合,說(shuō)明具有較好的可靠性,為礦產(chǎn)勘查方面新質(zhì)生產(chǎn)力的發(fā)展提供了新思路。

        2)在本次預(yù)測(cè)中,SMOTified-BRF模型表現(xiàn)優(yōu)于BRF模型,以AUC值作為評(píng)價(jià)指標(biāo)的情況下,SMOTified-BRF模型(0.9875)的表現(xiàn)優(yōu)于BRF模型(0.9726);基于約登指數(shù)指示的最優(yōu)閾值的情況下,SMOTified-BRF模型圈定出了更為精確的礦化面積占比(1.95%),相較于BRF模型(12.23%)更為準(zhǔn)確。

        3)基于SMOTified-BRF模型在漢濱—旬陽(yáng)地區(qū)圈定了3處未包含已知金礦床點(diǎn)的找礦遠(yuǎn)景區(qū),為進(jìn)一步找礦提供了新方向。

        [參考文獻(xiàn)]

        [1]習(xí)近平主持召開(kāi)新時(shí)代推動(dòng)?xùn)|北全面振興座談會(huì)強(qiáng)調(diào):牢牢把握東北的重要使命奮力譜寫(xiě)東北全面振興新篇章[N].人民日?qǐng)?bào),2023-09-10(01).

        [2]楊建鋒,余韻,姚曉峰,等.礦產(chǎn)勘查推動(dòng)新質(zhì)生產(chǎn)力發(fā)展路徑初探[J].中國(guó)礦業(yè),2024,33(5):39-45.

        [3]王登紅.試論稀散金屬礦產(chǎn)與新質(zhì)生產(chǎn)力[J].中國(guó)礦業(yè),2024,33(4):2-12,1.

        [4]朱清.發(fā)展AI找礦這種新質(zhì)生產(chǎn)力[N].中國(guó)礦業(yè)報(bào),2024-03-09.

        [5]張七道,肖長(zhǎng)源,李致偉,等.黔北普宜地區(qū)水系沉積物地球化學(xué)特征及成礦預(yù)測(cè)[J].地質(zhì)與勘探,2021,57(5):1040-1052.

        [6]安朝,李德彪,柴云,等.青海省東昆侖納赤臺(tái)地區(qū)正、負(fù)異常特征及找礦方向[J].黃金,2019,40(3):23-29.

        [7]張凱倫,溫守欽,汪徽,等.遼寧阜新排山樓金礦床深穿透地球化學(xué)找礦方法的應(yīng)用研究[J].黃金,2023,44(9):111-116.

        [8]ZUOR G.Exploration geochemical data mining and weak geochemi-cal anomalies identification[J].Earth Science Frontiers,2019,26(4):65-75.

        [9]zUORG,XIONG YH.Big data analytics of identifying geochemical anomalies supported by machine learning methods[J].Natural Resources Research,2018,27:5-13.

        [10]zUO RG,CARRANZA EJ M.Support vector machine:A tool for mapping mineral prospectivity[J].Computers and Geosciences,2011,37:1967-1975.

        [11]ABEDI M,NOROUZI GH,BAHROUDI A.Support vector machine for multi-classification of mineral prospectivity areas[J].Computers and Geosciences,2012,46:272-283.

        [12]RODRIGUEZ-GALIANO VF,CHICA-OLMO M,CHICA-RIVAS M.Predictive modelling of gold potential with the integration of mul-tisource information based on random forest:A case study on the Rodalquilar Area,Southern Spain[J].International Journal of Geo-graphical Information Science,2014,28:1336-1354.

        [13]CARRANZA EJM,LABORTE A G.Random forest predictive modeling of mineral prospectivity with small number of prospects and data with missing values in Abra(Philippines)[J].Computer and Geosciences,2015,74:60-70.

        [14]CHEN Y L.Mineral potential mapping with a restricted boltzmann machine[J].0re Geology Reviews,2015,71:749760.

        [15]SHAYILAN A,CHEN Y L.A smotified extreme learning machine for identifying mineralization anomalies from geochemical explora-tion data:A case study from the Yeniugou Area,Xinjiang,China[J].Earth Science Informatics,2024,17:1329-1343.

        [16]CHEN YL,DUXD,GUO M.Self-paced ensemble for constructing an efficient robust high-performance classification model for detec-ting mineralization anomalies from geochemical exploration data[J]Ore Geology Reviews,2023,157:105418.

        [17]GUO M,CHEN Y L.High-performance imbalanced learning ensem-bles of decision trees for detecting mineralization anomalies from geochemical exploration data[J].Journal of Geochemical Explora-tion,2024,259:107443.

        [18]CHAWLANV,BOWYER KW,HALLLO,et al.SMOTE:Synthetic minority over-sampling technique[J].Jounal of Artificial Intelli-gence Research,2002,16:321-357

        [19]YOUSRA A,AHMAD KM,BASIT R,et al.Predicting influential blogger's by a novel,hybrid and optimized case based reasoning approach with balanced random forest using imbalanced data[J].IEEE Access,2021,9:6836-6854.

        [20]姜萬(wàn)錄,馬歆宇,岳毅,等.類間數(shù)據(jù)不均衡條件下基于平衡隨機(jī)森林的軸向柱塞泵故障診斷方法[J].液壓與氣動(dòng),2022,46(3):45-54.

        [21]胡學(xué)敏,曾晟,宋良靈.基于灰狼算法改進(jìn)隨機(jī)森林算法的爆破振動(dòng)速度預(yù)測(cè)研究[J].黃金,2024,45(1):12-16.

        [22]廖華.陜西旬陽(yáng)爛木溝金礦控礦構(gòu)造與礦床成因[D].北京:中國(guó)地質(zhì)大學(xué)(北京),2020.

        [23]許鋒,李衛(wèi)波,宋公社,等.陜西石泉—旬陽(yáng)地區(qū)金礦床控礦因素與成礦模式[J].礦產(chǎn)勘查,2018,9(1):70-78.

        [24]鄒海洋,陳松嶺,胡祥昭.陜西旬陽(yáng)淋湘金礦床成礦機(jī)制[J].大地構(gòu)造與成礦學(xué),1997,21(3):221-227.

        [25]ZUO RG.Selection of an elemen tal association related to minerali-zation using spatial analysis[J].Journal of Geochemical Explora-tion,2018,184:150-157.

        [26]CHEN Y L.Mineral potential mapping with a restricted boltzmann machine[J].0re Geology Reviews,2015,71:749-760.

        [27]CHEN YL,WU W.Application of one-class support vector machine to quickly identify multivariate anomalies from geochemica exploration data[J].Geochemistry:Exploration,Environment,Analysis,2017,17(3):231-238.

        [28]PARSA M,MAGHSOUDI A,YOUSEFI M.A receiver operating characteristics-based geochemical data fusion technique for targe-ting undiscovered mineral deposits[J].Natural Resources Research,2017,27(1):15-28.

        [29]CHEN YL,AN A.Application of ant colony algorithm to geochemi-cal anomaly detection[J].Journal of Geochemical Exploration,2016,164:75-85.

        Research on geochemical gold mineralization anomaly prediction based on theSMOTified-BRF model

        —A case study of the Hanbin-Xunyang area,Shaanxi Province

        Xu Zhenglin',Wang Xi1,Xue Linfu1,Ran Xiangjin',Yan Qun1,Li Yongsheng2,3,Yu Xiaofei23

        (1.College of Earth Sciences,Jilin University;2.Development and Research Center,China Geological Survey;3.Mineral Exploration Technology Guidance Center,Ministry of Natural Resources)

        Abstract:Mineral exploration is not only a critical component of new quality productive forces but also a driving force for their development.To address the challenges of sample imbalance caused by the limited number of known mineralization samples and the scarcity of mineralization information in gold mineralization prediction during mineral exploration,this study proposes the SMOTified-BRF model.This model applies the SMOTE method to augment the extremely limited known mineralization samples and employs the balanced random forest(BRF)method for prediction.Using the Hanbin-Xunyang area as the study area,geochemical data from stream sediments were analyzed using the SMOTified-BRF and BRF models and compared the gold mineralization prediction outcome and model performance.The results show that the SMOTified-BRF model achieves a higher AUC value(0.9875)compared to the BRF model(0.9726).Additionally,at the optimal threshold indicated by the Youden index,the predicted mineralized area ratio of the SMOTified-BRF model(1.95%)is significantly smaller than that of the BRF model(12.23%),demonstrating that the SMOTified-BRF model offers more accurate and efficient performance in predicting gold mineralization anomalies.

        Keywords:gold mineralization;anomaly;prediction;balanced random forest;SMOTE;geochemistry;Hanbin-Xunyang area

        猜你喜歡
        模型研究
        一半模型
        FMS與YBT相關(guān)性的實(shí)證研究
        2020年國(guó)內(nèi)翻譯研究述評(píng)
        遼代千人邑研究述論
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        視錯(cuò)覺(jué)在平面設(shè)計(jì)中的應(yīng)用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        EMA伺服控制系統(tǒng)研究
        新版C-NCAP側(cè)面碰撞假人損傷研究
        3D打印中的模型分割與打包
        人妻中文字幕一区二区二区| 免费国产黄网站在线观看可以下载| 一区二区三区在线观看视频精品| 成人av片在线观看免费| 久久久久人妻精品一区蜜桃| 国产精品无码无片在线观看| 白白色发布永久免费观看视频| 国产一区二区黄色的网站| 欧美日韩亚洲中文字幕二区| 亚洲免费观看在线视频| 成人国产精品免费网站| 国产av天堂一区二区二区| 无码小电影在线观看网站免费| 国产午夜视频在线观看| 2021亚洲色中文字幕| 一区二区三区在线观看视频精品| 国产欧美成人一区二区a片| 综合三区后入内射国产馆| 亚洲色欲色欲欲www在线| 男女激情视频网站免费在线| 少妇中文字幕乱码亚洲影视| 国产乱子伦精品无码码专区| 国产精品性一区二区三区| 久久一区二区三区久久久| 国产精品无码无片在线观看3d| 国产精品精品| 国产偷拍自拍在线观看| 国产精品国产亚洲精品看不卡| 色婷婷久久综合中文久久蜜桃av| 天堂av一区二区在线观看| 日本肥老熟妇在线观看| 中文字幕一区久久精品| 97精品超碰一区二区三区| 亚洲欧美日韩综合中文字幕| 国产精品久久婷婷六月| 久久国产精品一国产精品金尊| 亚洲一区av无码少妇电影 | 午夜视频福利一区二区三区 | 一区二区传媒有限公司| 亚洲无码一二专区| 粗大挺进孕妇人妻在线|