亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合學習模型的巖石光譜特征自動分類

        2021-01-06 03:03:00賀金鑫任小玉陳圣波肖志強
        光譜學與光譜分析 2021年1期
        關鍵詞:反射率決策樹巖石

        賀金鑫,任小玉,陳圣波,熊 玥,肖志強,周 孩

        1. 吉林大學地球科學學院,吉林 長春 130061 2. 吉林大學地球探測科學與技術學院,吉林 長春 130061

        引 言

        在遙感地質領域,巖石光譜一直是熱門研究方向之一,主要包括成像光譜巖礦識別、巖石光譜特征分析、影響巖石光譜的因素以及巖石光譜分類。在巖石光譜分類方面,吳輝等基于AVIRIS航空高光譜遙感數(shù)據(jù),首先將預處理后的數(shù)據(jù)進行最小噪聲分離,然后用PPI算法選擇研究對象,最后用線性光譜混合分類模型進行巖性分類研究[1]; 張翠芬等人將巖石單元的圖形紋理特征及光譜特征進行協(xié)同分類研究,用面對對象方法進行圖譜指數(shù)分割,然后用光譜指數(shù)提取巖石信息,劃分精度較好[2]; 徐清俊等人使用ASD光譜儀測量鉆孔巖心數(shù)據(jù),利用ViewSpecpro軟件進行格式轉換,輸入到ENVI軟件建成光譜庫,與美國USGS光譜庫中典型礦物光譜曲線進行對比分析,進而識別巖性得出結論[3]; 周江將ASD光譜儀的光譜曲線與遙感影像通過ENVI軟件相結合對巖石等地物進行分類,與用神經(jīng)網(wǎng)絡進行監(jiān)督分類的結果相對比[4]??傊?,該領域目前的主要問題在于要么是將數(shù)據(jù)進行一系列復雜預處理后利用傳統(tǒng)模型進行分類; 要么因為巖石光譜的特殊性,沒有統(tǒng)一的光譜曲線標準,使得分類結果不夠準確。因此,本文擬在不對巖石光譜數(shù)據(jù)進行復雜預處理的前提下,構建一種基于融合多種機器學習模型的巖石光譜特征自動分類方法; 并與單一分類模型相對比,最終取得更高的分類準確率。

        1 巖石光譜數(shù)據(jù)

        1.1 研究區(qū)概況

        研究區(qū)位于遼寧省興城市,區(qū)域地貌屬遼西山地黑山丘陵東部邊緣的海濱丘陵,海拔在20~500 m之間,相對高差200~350 m,地勢總體呈西北高而東南低,區(qū)內河流發(fā)育,有六股河、煙臺河等匯入遼東灣; 氣候屬于北半球暖溫帶亞濕潤氣候,氣候溫和,干濕相宜[5]。

        興城地區(qū)出露的地層為典型的華北型,地層從太古宙到中—新元古界、古生界、中生界和新生界都有分布,發(fā)育較為齊全,主要巖石類型有花崗巖、砂巖、頁巖、白云巖、灰?guī)r、安山巖、玄武巖等[5](如圖1所示)。

        圖1 研究區(qū)巖性分布圖 1: 第四系: 礫石、黃土、粉質粘土; 2: 閃長巖; 3: 灰?guī)r; 4: 花崗巖; 5: 砂巖; 6: 安山巖; 7: 玄武巖Fig.1 Distribution of rocks in the study area

        1.2 巖石光譜測量

        用于測量巖石光譜的儀器為美國FieldSpec-3型便攜式實測光譜儀,所測波長從350 nm的可見光范圍分布到2 500 nm的短波紅外范圍??梢姽獾墓庾V測量間隔為1.4 nm,分辨率約為3 nm; 短波紅外的間隔為2 nm,分辨率為6.5~8.5 nm[6]。

        目前取得已命名巖石光譜類型有二長花崗巖、花崗斑巖、石英砂巖、中粒巖屑長石砂巖、白云質灰?guī)r、鮞狀灰?guī)r、燧石條帶白云巖等。將測量得到的光譜數(shù)據(jù)進行整合,最終得到灰?guī)r類379條數(shù)據(jù)、花崗巖類147條數(shù)據(jù)、砂巖類82條數(shù)據(jù),其余類別由于數(shù)據(jù)量過少,暫不予以分類研究(如圖2所示)。

        1.3 巖石光譜特征

        巖石光譜形狀與其成分、含量等等因素都密切相關。而同種巖石光譜形態(tài)基本相似; 實驗所得數(shù)據(jù)中,花崗巖和砂巖在1 400 nm左右處都存在水汽吸收帶(如圖3、圖5所示),在1 900 nm處,三類巖石光譜都存在較強吸收谷(如圖3—圖5所示); 花崗巖總體反射率在0~0.5之間,灰?guī)r總體反射率在0~0.7之間,砂巖總體反射率在0~0.6之間(如圖3—圖5所示); 砂巖在900 nm處存在鐵離子吸收譜帶,灰?guī)r在2 300 nm處產(chǎn)生碳酸根離子的特征吸收,石英砂巖、白云巖等幾類巖石在2 200 nm左右處有一個吸收谷,是由于羥基吸收所引起的[5]。

        圖2 總樣品數(shù)據(jù)集的巖石光譜反射率Fig.2 Reflectance spectra of the whole samples

        圖3 花崗巖光譜反射率Fig.3 Reflectance spectra of granite

        圖4 灰?guī)r光譜反射率Fig.4 Reflectance spectra of limestone

        圖5 砂巖光譜反射率Fig.5 Reflectance spectra of sandstone

        2 巖石光譜特征自動分類

        2.1 決策樹模型

        決策樹(decision tree,DT)是一個自上而下構建的樹形模型,包括根節(jié)點,父節(jié)點和子節(jié)點,一個分支就代表一個測試輸出。采用了決策樹模型中的CART算法,相比傳統(tǒng)數(shù)學統(tǒng)計方法分類更準確,且數(shù)據(jù)量越大越容易顯現(xiàn)其優(yōu)越性。CART算法計算基尼系數(shù)來評判數(shù)據(jù)劃分前后的分類效果,基尼系數(shù)越小證明數(shù)據(jù)純度越高; 所以選擇能使分類后得到的基尼系數(shù)最小的特征,將其作為樹中節(jié)點[7]。用CART決策樹對三類巖石光譜數(shù)據(jù)的訓練集建模,然后用測試集檢驗分類效果。將樹的深度設置為10; 節(jié)點不純度小于0.02,即不再生成子節(jié)點,節(jié)點再劃分所需最小樣本數(shù)設為2。

        2.2 隨機森林模型

        為提高分類準確率,又選取了決策樹的升級模型——隨機森林(random forest,RF),它是基于bagging策略的集成學習,通過多棵樹對數(shù)據(jù)樣本分類。包含兩個隨機過程: 一是輸入數(shù)據(jù)隨機; 二是分類特征隨機選取。這樣就得到了多顆CART決策樹弱分類器,再將多個分類器采取投票法的策略,投出票數(shù)最多的作為最終結果[8]。RF的參數(shù)也分為兩部分: 一是隨機森林的Bagging框架參數(shù),其中CART決策樹的最大迭代次數(shù)設置為1 000,劃分CART決策樹特征的評價標準選用基尼系數(shù); 二是決策樹參數(shù),深度25,劃分最大特征數(shù)為45,節(jié)點再劃分所需最小樣本數(shù)設為2。

        2.3 K-最近鄰模型

        隨機森林模型在數(shù)據(jù)噪音較大時易陷入過擬合,且數(shù)據(jù)特征過多時也會對模型準確率造成較大影響。而K-最近鄰模型(K-nearest neighbor,KNN)依據(jù)不同特征值間的距離進行分類,不存在訓練過程,只是將最近的劃分為一類。先將數(shù)據(jù)標準化; 然后算出輸入的數(shù)據(jù)與測試集的數(shù)據(jù)的距離,實驗采取的計算距離方法為閔可夫斯基距離; 找出距離最近的k個,這里k設置為1; 將出現(xiàn)最多的類別作為輸入數(shù)據(jù)的類別[9]。但KNN需要對每個樣本都予以考慮,當數(shù)據(jù)量大時計算量會很大,效率不高。

        2.4 支持向量機模型

        支持向量機模型(support vector machine,SVM)是通過在數(shù)據(jù)間找到距離最大處來工作的,而數(shù)據(jù)是否線性可分決定著是用硬間隔最大化還是軟間隔最大化[10]。由于巖石光譜數(shù)據(jù)非線性可分,因而將數(shù)據(jù)映射到新空間,使之線性可分。核函數(shù)選高斯核函數(shù); 懲罰系數(shù)設為10; gamma值設定為1。

        2.5 多種模型相融合

        為進一步提高巖石光譜特征自動分類的準確率,采取了融合多個不同模型的辦法,即對不同模型的分類結果進行投票,選擇投票最多的作為最后分類結果。在此基礎上又分為硬投票和軟投票,硬投票是直接對模型投票而軟投票加入了權重,可以區(qū)分不同模型的重要度,但二者的基本原則都是少數(shù)服從多數(shù)。由于硬投票可在一定程度上減少過擬合現(xiàn)象的發(fā)生,更加適合分類模型,所以選用了硬投票方法。

        3 結果與討論

        將巖石光譜數(shù)據(jù)特征分別導入DT,RF,KNN,SVM以及融合模型(全部基于Python語言編程實現(xiàn))之中,分類結果如表1所示??梢钥闯鲈谒姆N單一分類模型中: 效果最好的是支持向量機,分類準確率為98.76%; 其次是K-最近鄰,準確率為97.10%; 然后是隨機森林,準確率為93.80%; 最后是決策樹模型,準確率為88.84%。而將RF,KNN和SVM三種模型融合后得到的巖石光譜分類準確率可達到99.17%。

        表1 不同模型的巖石光譜特征自動分類準確率Table 1 Classification accuracy of rock spectrabased on different models

        4 結 論

        在遼寧興城地區(qū)實測的不同巖石反射光譜數(shù)據(jù)特征基礎之上,分別利用DT,RF,KNN,SVM以及融合模型,進行了巖石光譜特征自動分類研究。從測試結果可以看出: 第一,如果不考慮影響巖石光譜特征的各種因素,直接從光譜數(shù)據(jù)特征本身入手,可以發(fā)現(xiàn)機器學習模型的分類能力相對于傳統(tǒng)的巖石光譜分類方式,效率更高、分類準確率更好; 第二,四種單一機器學習模型的分類準確率高低排序為: SVM>KNN>RF>DT; 第三,采用了多種模型融合學習的方法,進一步提高了巖石光譜特征自動分類的準確率,可達99.17%。在后續(xù)研究工作中,將繼續(xù)優(yōu)化現(xiàn)有模型,使之不僅能劃分巖石大類,還能準確地對細類巖性進行劃分。

        猜你喜歡
        反射率決策樹巖石
        影響Mini LED板油墨層反射率的因素
        近岸水體異源遙感反射率產(chǎn)品的融合方法研究
        海洋通報(2022年4期)2022-10-10 07:40:26
        具有顏色恒常性的光譜反射率重建
        第五章 巖石小專家
        3深源巖石
        一種叫做煤炭的巖石
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        海藻與巖石之間
        決策樹和隨機森林方法在管理決策中的應用
        電子制作(2018年16期)2018-09-26 03:27:06
        化學腐蝕硅表面結構反射率影響因素的研究*
        電子器件(2017年2期)2017-04-25 08:58:37
        48久久国产精品性色aⅴ人妻 | 亚洲国产精品一区二区第一| 亚洲av激情一区二区| 五月四房播播| 97久久精品人人做人人爽| 天天射色综合| 中文字幕综合一区二区| 中文字幕亚洲精品无码| 国产人澡人澡澡澡人碰视频| 亚欧同人精品天堂| 在线观看在线观看一区二区三区| 国产欧美成人一区二区a片| 亚洲日本va午夜在线影院| 韩国三级大全久久网站| 国产三级精品三级在线专区2| 国产成人午夜无码电影在线观看| 日韩一欧美内射在线观看| 日本高清一区二区三区视频 | 爆操丝袜美女在线观看| 精品欧洲av无码一区二区| 亚洲中文欧美日韩在线人| 久久久免费精品国产色夜| 奇米影视色777四色在线首页| 一本大道久久香蕉成人网| 两个人免费视频大全毛片| 麻豆国产精品一区二区三区| 芒果乱码国色天香| 国产人在线成免费视频麻豆| 久久伊人久久伊人久久| 无套内内射视频网站| 亚洲男人天堂| 国产香蕉一区二区三区| 亚洲综合一区二区三区天美传媒| 无码福利写真片视频在线播放| 亚洲tv精品一区二区三区| 亚洲中文字幕一区av| 午夜精品久久久久久久99热| 99re这里只有热视频| 亚洲国产人成自精在线尤物| 夜夜夜夜曰天天天天拍国产| 国产精品揄拍100视频|