亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        機(jī)器學(xué)習(xí)方法在礦產(chǎn)勘查中的應(yīng)用

        2021-04-19 00:59:24趙偉光陳軍林
        世界有色金屬 2021年1期
        關(guān)鍵詞:礦產(chǎn)勘查機(jī)器

        趙偉光,陳 磊,陳軍林

        (1.礦冶科技集團(tuán)有限公司,金屬礦產(chǎn)資源評價(jià)與分析檢測北京市重點(diǎn)實(shí)驗(yàn)室,北京 102628;2.中國石油川慶鉆探工程有限公司工程技術(shù)研究院,陜西 西安 710018;3.中國地質(zhì)大學(xué)(北京)地球科學(xué)與資源學(xué)院,北京 100083)

        機(jī)器學(xué)習(xí)是近些年來興起的一門人工智能科學(xué),人工智能是該領(lǐng)域的主要研究對象,尤其對如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能關(guān)注更甚[1]。機(jī)器學(xué)習(xí)是對能通過經(jīng)驗(yàn)自動(dòng)改進(jìn)的計(jì)算機(jī)算法的研究,而不是在明確編程的情況下做出反應(yīng)。其一般流程是:通過輸入數(shù)據(jù)建立模型,選擇相應(yīng)的算法進(jìn)行模型訓(xùn)練,從數(shù)據(jù)中自動(dòng)分析發(fā)現(xiàn)規(guī)律,并利用規(guī)律對數(shù)據(jù)進(jìn)行預(yù)測。機(jī)器學(xué)習(xí)的應(yīng)用已經(jīng)十分廣泛,比如數(shù)據(jù)挖掘、計(jì)算機(jī)視覺、自然語言處理、搜索引擎、機(jī)器翻譯等等。機(jī)器學(xué)習(xí)通??煞譃楸O(jiān)督學(xué)習(xí)(Supervised learning)和非監(jiān)督學(xué)習(xí)(Unsupervised learning)兩大類。監(jiān)督學(xué)習(xí)是利用一組已知類別的樣本調(diào)整分類器的參數(shù),使其達(dá)到所要求性能的過程,也稱為監(jiān)督訓(xùn)練或有教師學(xué)習(xí),一般用來做分類和回歸。非監(jiān)督學(xué)習(xí)則是在未加標(biāo)簽的數(shù)據(jù)中,試圖找到隱藏的結(jié)構(gòu),輸入數(shù)據(jù)的類別是未知的,一般用來做聚類分析[2]。

        由于人類進(jìn)入了信息化、數(shù)字化時(shí)代,對數(shù)據(jù)的依賴和生產(chǎn)數(shù)據(jù)的能力大大超過以前,大量的數(shù)據(jù)需求使得機(jī)器學(xué)習(xí)這門處理數(shù)據(jù)的新興學(xué)科得到了迅速發(fā)展,形成了多種多樣的機(jī)器學(xué)習(xí)算法。機(jī)器學(xué)習(xí)在處理大數(shù)據(jù)集以及復(fù)雜的數(shù)據(jù)結(jié)構(gòu)中相比傳統(tǒng)的統(tǒng)計(jì)學(xué)方法有明顯的優(yōu)勢,因此被大量應(yīng)用在地球科學(xué)的研究當(dāng)中,特別是油氣勘探、地球物理、遙感圖像處理等領(lǐng)域[3-5]。

        地質(zhì)學(xué)傳統(tǒng)地屬于定性的、推理的、歷史的科學(xué),這主要是因?yàn)樵S多地質(zhì)現(xiàn)象本身的性質(zhì)以及傳統(tǒng)的地質(zhì)學(xué)研究方法大多是非數(shù)學(xué)的[6]。但隨著認(rèn)識(shí)程度的轉(zhuǎn)變和研究方法以及新的技術(shù)手段的發(fā)展,現(xiàn)在的地質(zhì)學(xué)已經(jīng)進(jìn)入了定量化、數(shù)據(jù)化時(shí)代,像地球物理、遙感、勘查學(xué)等地質(zhì)分支學(xué)科都已經(jīng)高度依賴數(shù)據(jù)。

        礦產(chǎn)勘查是地質(zhì)學(xué)的重要學(xué)科分支,是地學(xué)領(lǐng)域里面對數(shù)據(jù)依賴程度較高的學(xué)科。在礦產(chǎn)勘查中,要做到對礦產(chǎn)資源的定位、定量、定概率,就需要對研究對象進(jìn)行大量的數(shù)據(jù)采集,從而形成豐富的數(shù)據(jù)資料。這些數(shù)據(jù)往往規(guī)模龐大,結(jié)構(gòu)復(fù)雜,要從這些數(shù)據(jù)中挖掘出反映礦產(chǎn)資源的有用信息,就需要高效的數(shù)據(jù)挖掘技術(shù)。傳統(tǒng)的方法如證據(jù)權(quán)法[7]、模糊邏輯[8]、邏輯回歸[9]等,有效支持了礦產(chǎn)勘查的發(fā)展,但其中的不足之處也很明顯。機(jī)器學(xué)習(xí)方法的興起為地學(xué)數(shù)據(jù)的處理帶來了新的思路和方法。將礦產(chǎn)勘查和機(jī)器學(xué)習(xí)方法相結(jié)合的文章已經(jīng)非常多,如神經(jīng)網(wǎng)絡(luò)[10,11]、支持向量機(jī)(SVM)[12,13]。研究表明機(jī)器學(xué)習(xí)的方法比傳統(tǒng)的統(tǒng)計(jì)方法(如邏輯回歸)精確度更高,尤其是當(dāng)特征空間較為復(fù)雜(如高維數(shù)據(jù)以及輸入輸出呈現(xiàn)非線性關(guān)系的數(shù)據(jù))或數(shù)據(jù)的統(tǒng)計(jì)分布規(guī)律較為復(fù)雜時(shí)[12-14]。機(jī)器學(xué)習(xí)在礦產(chǎn)勘查中的應(yīng)用已經(jīng)形成了一股熱潮,本文擬通過介紹這些應(yīng)用實(shí)例探討機(jī)器學(xué)習(xí)方法在礦產(chǎn)勘查中的應(yīng)用以及需要注意的問題。

        1 常用機(jī)器學(xué)習(xí)方法在礦產(chǎn)勘查中的應(yīng)用

        目前應(yīng)用最多的幾種模型主要是基于決策樹方法(DTs)[15],神經(jīng)網(wǎng)絡(luò)方法(ANNs)[8,14,16]、支持向量機(jī)[12,17]、隨機(jī)森林等[15,18],概由于這幾種方法表現(xiàn)出色且實(shí)現(xiàn)難度低。

        1.1 神經(jīng)網(wǎng)絡(luò)

        圖1 典型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

        神經(jīng)網(wǎng)絡(luò)模型提出于20 世紀(jì)40 年代,主要用來解決函數(shù)逼近、模式識(shí)別、分類等問題。通過模擬生物神經(jīng)系統(tǒng)對真實(shí)世界物體所作出的交互反應(yīng)來工作,是由具有適應(yīng)性的簡單單元組成的廣泛并行互聯(lián)的網(wǎng)絡(luò)[19]。正如在人腦中一樣,神經(jīng)網(wǎng)絡(luò)的基本組成單元是神經(jīng)元,每個(gè)神經(jīng)元的結(jié)構(gòu)和功能比較簡單,但大量神經(jīng)元組合產(chǎn)生的系統(tǒng)行為卻非常復(fù)雜。

        神經(jīng)網(wǎng)絡(luò)是由許多單個(gè)神經(jīng)元相互聯(lián)接而成的自適應(yīng)非線性動(dòng)態(tài)系統(tǒng)。神經(jīng)元間的連接權(quán)值反映了單元間的連接強(qiáng)度,信息的表示和處理體現(xiàn)在網(wǎng)絡(luò)處理單元的連接關(guān)系中。神經(jīng)網(wǎng)絡(luò)中處理單元的類型分為三類:輸入層、輸出層和隱藏層。輸入層接受外部世界的信號(hào)與數(shù)據(jù);輸出層實(shí)現(xiàn)系統(tǒng)處理結(jié)果的輸出;隱藏層是處在輸入和輸出單元之間,不能由系統(tǒng)外部觀察的單元。典型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。

        神經(jīng)網(wǎng)絡(luò)在地學(xué)中應(yīng)用的文章非常多,在礦產(chǎn)勘查中的應(yīng)用也比較廣泛[8,14,16,20],如李曉暉等利用人工神經(jīng)網(wǎng)絡(luò)對寧蕪盆地白象山礦區(qū)進(jìn)行了三維成礦定位預(yù)測研究,預(yù)測結(jié)果表明,將人工神經(jīng)網(wǎng)絡(luò)應(yīng)用于三維成礦定位預(yù)測能很好的定位出已知礦體,同時(shí)能夠有效的預(yù)測靶區(qū),是對隱伏礦、盲礦進(jìn)行成礦預(yù)測和優(yōu)選靶區(qū)的有效方法[20]。

        雖然神經(jīng)網(wǎng)絡(luò)有許多優(yōu)勢,但也有明顯的局限性,如訓(xùn)練ANNs 需要對大量的參數(shù)進(jìn)行設(shè)置,參數(shù)的好壞直接影響模型的精度,而調(diào)試參數(shù)的過程往往費(fèi)時(shí)費(fèi)力;無法解釋自己的推理過程和推理依據(jù);向用戶提出必要的詢問是無法做到的,而且當(dāng)數(shù)據(jù)不充分的時(shí)候就會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)無法進(jìn)行工作;把一切問題的特征都數(shù)字化,把一切推理都數(shù)值計(jì)算化,信息丟失無法避免。

        1.2 支持向量機(jī)

        相對于神經(jīng)網(wǎng)絡(luò)來說,決策樹方法需要設(shè)置的參數(shù)較少,自動(dòng)化程度高,但容易出現(xiàn)過擬合的問題[15]?;谝陨显蛏窠?jīng)網(wǎng)絡(luò)和決策樹越來越多的被新基于核的方法如SVM 和集成方法如RF 所代替。

        支持向量機(jī)是近年來提出的一種新的機(jī)器學(xué)習(xí)方法,最早由Vapnik 在20 世紀(jì)60 年代提出,起初被用作線性二分類,后來發(fā)展出非線性、多分類、回歸等新的功能[17]。他有許多特有的優(yōu)勢,如在解決小樣本、非線性及高維模式識(shí)別中發(fā)揮了較大的作用,然而解決分類和回歸問題是其主要功能。其主要原理是在n 維空間中找到一個(gè)分類超平面,利用該超平面對空間上的點(diǎn)進(jìn)行分類。如圖2a 所示,一個(gè)點(diǎn)距離超平面的遠(yuǎn)近可以表示為分類預(yù)測的確信或準(zhǔn)確程度,SVM 就是要最大化這個(gè)間隔值,而在虛線上的點(diǎn)便叫做支持向量(Supprot Verctor)。實(shí)際中會(huì)經(jīng)常遇到線性不可分的樣例,常用的做法是將輸入向量映射到一個(gè)更高維的空間里,在這個(gè)高維空間里建立有一個(gè)最大間隔超平面,從而實(shí)現(xiàn)分類(圖2b)。SVM 的關(guān)鍵在于核函數(shù),通過核函數(shù)將難于劃分的低維空間向量映射到高維空間,只要選用適當(dāng)?shù)暮撕瘮?shù),就可以得到高維空間的分類函數(shù),采用不同的核函數(shù)將導(dǎo)致不同的SVM 算法。

        已知該算法被應(yīng)用的主要有:地球物理反演當(dāng)中解決非線性反演、天氣預(yù)報(bào)工作、遙感圖像處理等。Renguang Zuo[12]和Carranza[21]利用支持向量機(jī)對加拿大某地金成礦遠(yuǎn)景進(jìn)行了預(yù)測。

        基本思路是:根據(jù)控礦因素選擇數(shù)據(jù),形成證據(jù)層(如地質(zhì)、物探、化探、遙感),構(gòu)成輸入數(shù)據(jù)數(shù)據(jù)X,以區(qū)域上有礦產(chǎn)產(chǎn)出的n 個(gè)點(diǎn)以及n 個(gè)非礦產(chǎn)點(diǎn)作為輸出數(shù)據(jù)y(兩個(gè)值,有礦和無礦),訓(xùn)練支持向量機(jī)模型,找到一個(gè)映射函數(shù)f(X),可以近似的反映數(shù)據(jù)X 和礦化y 之間的關(guān)系,從而利用該映射關(guān)系和新的勘查數(shù)據(jù)集Xnew 對未知區(qū)域進(jìn)行礦產(chǎn)資源潛力預(yù)測。結(jié)果表明該方法精度遠(yuǎn)遠(yuǎn)高于傳統(tǒng)的證據(jù)權(quán)方法,能夠有效提高成礦預(yù)測能力。

        圖2 支持向量機(jī)原理示意圖

        圖3 RF 算法示意圖

        1.3 隨機(jī)森林

        隨機(jī)森林是一種集成方法(ensemble),由Breiman[15]于2001 年提出。它使用的抽樣方法是bootsrap 重抽樣方法,首先從原始樣本中抽取多個(gè)樣本,然后對每個(gè)bootsrap樣本進(jìn)行決策樹建模,最后組合多棵決策樹的預(yù)測,通過投票得出最終預(yù)測結(jié)果。

        RF 算法(圖3)不需要人為調(diào)試很多參數(shù),能夠有效降低過擬合現(xiàn)象;處理高維度數(shù)據(jù)能力強(qiáng);不用做特征選擇,能夠給出哪些變量比較重要;對于不平衡的分類數(shù)據(jù)集來說,它可以平衡誤差;在建造森林過程中,它可以在內(nèi)部對于一般化后的誤差產(chǎn)生不偏差的估計(jì);可以估計(jì)遺失的資料,并且,如果有很大一部分的資料遺失,仍可以維持準(zhǔn)確度,對異常值和噪聲具有很好的容忍度;速度快,訓(xùn)練過程中能夠檢測到變量間的互相影響,易做成并行化方法,實(shí)現(xiàn)簡單?;谝陨蟽?yōu)勢,RF 是近年機(jī)器學(xué)習(xí)領(lǐng)域研究的熱門之一。

        Carranza[21]等利用RF 方法對菲律賓某地的斑巖銅礦成礦遠(yuǎn)景進(jìn)行了預(yù)測,與證據(jù)權(quán)法進(jìn)行了對比研究,結(jié)果表明該方法表現(xiàn)優(yōu)于傳統(tǒng)的證據(jù)權(quán)方法。證據(jù)權(quán)方法是傳統(tǒng)的礦產(chǎn)勘查中較為成熟的模型,它的提出大大提高了礦產(chǎn)勘查的定量化研究程度,具有重要的意義,但同時(shí)也存在著許多劣勢,如證據(jù)層二值化問題、條件獨(dú)立性假設(shè)問題等,這些統(tǒng)統(tǒng)都可以通過RF 方法解決。

        相對于ANN 和SVM 模型,RF 能夠更好的處理訓(xùn)練數(shù)據(jù)集中標(biāo)簽值較少的情況。它不像ANN 那樣是一個(gè)黑箱,而是一個(gè)可探究的方法。

        資源量估算是礦產(chǎn)勘查中的重要環(huán)節(jié),傳統(tǒng)的方法主要是以統(tǒng)計(jì)學(xué)為基礎(chǔ)的方法,如克里格法、SD 法(最佳結(jié)構(gòu)曲線斷面積分儲(chǔ)量計(jì)算法)、斷面法(亦稱剖面法)和以及塊段法等。傳統(tǒng)方法基于一個(gè)重要的假設(shè):用來估算儲(chǔ)量的樣品是隨機(jī)和相互獨(dú)立的。但實(shí)際當(dāng)中,一個(gè)研究區(qū)內(nèi)用于估算資源量的樣品通常是相互有聯(lián)系的,這條假設(shè)通常不能滿足。并且,傳統(tǒng)方法在處理輸入輸出數(shù)據(jù)之間線性關(guān)系的數(shù)據(jù)時(shí)效果更好,對于非線性關(guān)系的數(shù)據(jù)有一定的局限性。機(jī)器學(xué)習(xí)的方法能夠克服上述的不足,將機(jī)器學(xué)習(xí)應(yīng)用到了資源量估算中的研究已非常多[22-24],這些方法總體來說能夠克服傳統(tǒng)方法的一系列缺陷,從而提高資源量計(jì)算精度,而且大大提高了計(jì)算過程的自動(dòng)化。

        此外,機(jī)器學(xué)習(xí)中的其他算法如聚類、降維、關(guān)聯(lián)分析等在礦產(chǎn)勘查中的應(yīng)用也非常廣泛,限于篇幅,不再贅述。

        2 需要注意的問題

        每種算法都有其優(yōu)勢和劣勢,實(shí)際應(yīng)用中應(yīng)根據(jù)具體需求選用,往往是對多種方法測試對比,最終選擇出最適合的方法。

        算法的選擇固然重要,數(shù)據(jù)本身的問題也不可忽視。在應(yīng)用機(jī)器學(xué)習(xí)算法處理礦產(chǎn)勘查數(shù)據(jù)時(shí),以下幾個(gè)常見問題需要注意。

        2.1 訓(xùn)練數(shù)據(jù)的不確定性 (Training Data Uncertainty)

        勘查數(shù)據(jù)來源于觀察和測量,這就不可避免的造成了一些不同程度的不確定性,以化探數(shù)據(jù)為例,采樣方法、分析方法、檢出限高低等都會(huì)影響到數(shù)據(jù)的準(zhǔn)確性。而地質(zhì)數(shù)據(jù)比如地質(zhì)單元的劃分,由于研究者認(rèn)識(shí)水平的高低不一也容易影響準(zhǔn)確性。

        同時(shí)研究精度(如采樣精度、研究尺度)和研究方式也影響到數(shù)據(jù)的質(zhì)量。此外,原始數(shù)據(jù)往往還可能存在不一致、重復(fù)、缺失、含噪聲等問題,會(huì)對最終結(jié)果造成很大影響,需要進(jìn)行數(shù)據(jù)預(yù)處理。數(shù)據(jù)處理過程中也可能造成不確定性的發(fā)生,如插值過程中,插值點(diǎn)是由周圍的實(shí)測點(diǎn)通過一定方法計(jì)算出來的,而不是直接測量所得,與真實(shí)的情況肯定有一定出入。另外,處理過程中的方法選擇,參數(shù)選取,都可能造成數(shù)據(jù)質(zhì)量的下降。

        2.2 訓(xùn)練標(biāo)簽的不確定性 (Training-Label Uncertainty)

        所謂標(biāo)簽就是類別,比如一個(gè)數(shù)據(jù)點(diǎn),是礦點(diǎn)還是非礦點(diǎn),有礦或非礦就是該點(diǎn)的標(biāo)簽,訓(xùn)練數(shù)據(jù)的標(biāo)簽影響到最終分類結(jié)果。

        在大部分情況下,非礦只意味著礦化還未被發(fā)現(xiàn),而不是十分確定的無礦。有礦與無礦不是截然區(qū)別的兩類,而是有一個(gè)變化范圍。比如,在許多有礦的實(shí)例中,有礦意味著有礦山,也可能僅僅只是礦點(diǎn)或礦化,將它們歸為一類,在處理中可能會(huì)造成很多問題。

        2.3 數(shù)據(jù)的不均衡性

        在大多數(shù)監(jiān)督學(xué)習(xí)算法中,都是通過等量選取每個(gè)類別的樣品進(jìn)行無偏訓(xùn)練,如果每個(gè)類別選取數(shù)量不等,那么就涉及到數(shù)據(jù)的非均衡分布[25]。在一個(gè)數(shù)據(jù)集中有稀有類和多數(shù)類之分,稀有類指一個(gè)或一些類實(shí)例數(shù)很少,而多數(shù)類指一個(gè)或一些類實(shí)例很多。

        通常把這些數(shù)據(jù)集的分類問題稱為非平衡數(shù)據(jù)集分類(也稱稀有類分類)[26]。如在一個(gè)勘查區(qū)內(nèi),大部分時(shí)候都是礦產(chǎn)地的出現(xiàn)少于非礦產(chǎn)地,異常區(qū)少于背景區(qū),從而造成了數(shù)據(jù)的不均衡性。普通的機(jī)器學(xué)習(xí)方法在非平衡數(shù)據(jù)集上往往失效,因?yàn)樗鼈兘⒃谟?xùn)練數(shù)據(jù)集上并輸出最簡單的假設(shè)適應(yīng)這些數(shù)據(jù),稀有類數(shù)據(jù)在訓(xùn)練數(shù)據(jù)集中占很小的比例,算法傾向多數(shù)類數(shù)據(jù),因此其在稀有類數(shù)據(jù)上的效果很差,而稀有類數(shù)據(jù)往往是有顯著意義的數(shù)據(jù)。目前關(guān)于非均衡數(shù)據(jù)集的處理,主要有兩種途徑,即隨機(jī)過抽樣(randomly over sampling)和隨機(jī)欠抽樣(randomly under sampling)[27]。

        2.4 大數(shù)據(jù)問題

        因?yàn)榈V產(chǎn)的出現(xiàn)是低概率事件,為了提高找礦概率,一般都在較大范圍內(nèi)進(jìn)行研究。而且涉及的數(shù)據(jù)類別包括地質(zhì)、物探、化探、遙感等多個(gè)數(shù)據(jù)層,每個(gè)數(shù)據(jù)層又可能包含大量數(shù)據(jù)。

        尤其是隨著現(xiàn)代測試分析技術(shù)以及探測技術(shù)精度的提高,往往導(dǎo)致數(shù)據(jù)量大大增加。這些諸多因素使得勘查數(shù)據(jù)形成巨大的數(shù)據(jù)量,這就涉及到大數(shù)據(jù)問題。大數(shù)據(jù)是近年來的研究熱點(diǎn),對于龐大的地質(zhì)大數(shù)據(jù)該如何有效地組織和使用,如何進(jìn)行科學(xué)的挖掘,產(chǎn)生更高的價(jià)值,以實(shí)現(xiàn)相應(yīng)的服務(wù),是時(shí)下地質(zhì)大數(shù)據(jù)研究的主要問題[28]。在數(shù)據(jù)處理中要考慮到大數(shù)據(jù)的問題,選擇合適的方法。

        2.5 特征選擇問題

        所謂特征選擇是指從已有的M 個(gè)特征(Feature)中選擇N 個(gè)特征使得系統(tǒng)的特定指標(biāo)最優(yōu)化,是從原始特征中選擇出一些最有效特征(有效性通過同類樣本的不變性、不同樣本的鑒別性、對噪聲的魯棒性來評價(jià))以降低數(shù)據(jù)集維度的過程,是提高學(xué)習(xí)算法性能的一個(gè)重要手段,也是模式識(shí)別中關(guān)鍵的數(shù)據(jù)預(yù)處理步驟[29-31]。對于一個(gè)學(xué)習(xí)算法來說,好的特征是訓(xùn)練模型的關(guān)鍵。

        在礦產(chǎn)勘查中,作為證據(jù)層的地質(zhì)、物探、化探、遙感數(shù)據(jù)為模型建立提供多個(gè)維度的數(shù)據(jù),這些數(shù)據(jù)可分解為多個(gè)變量。特征選擇就是要選擇出哪些對于預(yù)測模型最優(yōu)的變量。單從化探來說,就可能包含多個(gè)元素,這些元素中有的對成礦有指示意義,有些沒有。

        對于預(yù)測沒有意義的特征不僅會(huì)降低模型預(yù)測能力,還會(huì)增加冗余度,造成運(yùn)算量增加。特征的選擇可根據(jù)研究對象的某些性質(zhì)選取(如根據(jù)勘查對象的成礦規(guī)律、控礦因素等)結(jié)合特征選擇算法進(jìn)行選擇。

        3 小結(jié)

        用數(shù)據(jù)的方法來研究科學(xué),用科學(xué)的方法來研究數(shù)據(jù),具體到礦產(chǎn)勘查當(dāng)中,就是要用定量化的方法研究礦產(chǎn)資源,在數(shù)據(jù)處理過程中,要緊跟數(shù)據(jù)科學(xué)的步伐,用高效的數(shù)據(jù)挖掘方法處理勘查數(shù)據(jù)。機(jī)器學(xué)習(xí)是當(dāng)下數(shù)據(jù)科學(xué)的熱門課題,機(jī)器學(xué)習(xí)算法在地學(xué)研究中的應(yīng)用越來越多。其中神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林幾種算法應(yīng)用最為廣泛,這些方法的使用大大提高了礦產(chǎn)勘查數(shù)據(jù)的處理效率,為礦產(chǎn)勘查數(shù)據(jù)的處理提供了新的途徑和思路。選用合適的算法能夠大大提高數(shù)據(jù)處理效率,從數(shù)據(jù)中挖掘出更多有用信息。但這些方法的使用中也經(jīng)常容易出現(xiàn)一些問題,必須熟悉每種方法的原理和特點(diǎn),才能更好的應(yīng)用。同時(shí),數(shù)據(jù)本身的問題也不可忽視,在利用機(jī)器學(xué)習(xí)算法處理勘查數(shù)據(jù)時(shí),要考慮到以下幾個(gè)問題:訓(xùn)練數(shù)據(jù)的不確定性、訓(xùn)練標(biāo)簽的不確定性、數(shù)據(jù)的不均衡性、大數(shù)據(jù)問題、特征選擇問題。

        猜你喜歡
        礦產(chǎn)勘查機(jī)器
        機(jī)器狗
        《林業(yè)勘查設(shè)計(jì)》簡介
        《林業(yè)勘查設(shè)計(jì)》征稿簡則
        機(jī)器狗
        《礦產(chǎn)綜合利用》征稿啟事
        《林業(yè)勘查設(shè)計(jì)》征稿簡則
        《礦產(chǎn)綜合利用》征稿啟事
        地球物理勘查技術(shù)在地?zé)豳Y源勘查中的應(yīng)用
        盤點(diǎn)2020國內(nèi)礦產(chǎn)新發(fā)現(xiàn)(二)
        未來機(jī)器城
        電影(2018年8期)2018-09-21 08:00:06
        国产女同一区二区在线| 成人午夜福利视频镇东影视| 亚洲中文有码字幕青青| 久久国产乱子精品免费女| 国产av精品一区二区三区视频| 国产精品日日做人人爱| 亚洲国产精品va在线播放| 伊人一道本| 日本激情一区二区三区| 久久亚洲道色综合久久| 欧洲女人性开放免费网站| 亚洲七七久久综合桃花| 国产一区亚洲一区二区| 日本一区二区视频免费在线看| 中文字幕v亚洲日本| 国产极品美女高潮抽搐免费网站| 最新日本免费一区二区三区| 337p日本欧洲亚洲大胆色噜噜 | 韩日无码不卡| 伊人久久大香线蕉av最新午夜| 国产特黄级aaaaa片免| 日韩精品无码久久一区二区三| 麻豆av一区二区天堂| 粉嫩极品国产在线观看免费一区| 日韩人妻无码精品久久久不卡| 天天综合久久| 国产三级一区二区三区在线观看| 精品午夜福利在线观看| 黄色视频在线免费观看| 亚州五十路伊人网| 国产精品国产自产自拍高清av| 欧美黑人性暴力猛交喷水| 欧美国产日本精品一区二区三区| 亚洲精品国产av成人网| 天天躁日日躁狠狠躁欧美老妇小说| 亚洲狠狠婷婷综合久久| 一区二区特别黄色大片| 中文字幕日韩有码在线| 东京无码熟妇人妻av在线网址| 日本视频一区二区三区免费观看 | 亚洲综合色无码|