亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林和支持向量機(jī)的森林健康情況分析

        2023-05-30 12:21:30岳麗婭鄧潔瑩梁霄
        關(guān)鍵詞:隨機(jī)森林支持向量機(jī)數(shù)據(jù)挖掘

        岳麗婭 鄧潔瑩 梁霄

        關(guān)鍵詞:數(shù)據(jù)挖掘;患病樹木檢測;隨機(jī)森林;支持向量機(jī)

        1引言

        如今,林木健康問題已得到社會(huì)各界前所未有的關(guān)注,而中國傳統(tǒng)的樣地檢測和受控實(shí)驗(yàn)等方法需要耗費(fèi)大量人力物力,且得出具體結(jié)論所需時(shí)間往往較長,使林業(yè)健康檢測喪失時(shí)效性。故傳統(tǒng)手段具有一定局限性。而遙感是避免接觸,目標(biāo)距離較遠(yuǎn)的一種探測技術(shù),其能夠?yàn)檠芯咳藛T提供更高緯度的視野,可以有效收集并且處理復(fù)雜時(shí)空維度下的海量信息。本項(xiàng)目基于高分辨率遙感數(shù)據(jù),結(jié)合統(tǒng)計(jì)學(xué)相關(guān)理論知識(shí)以及新興的數(shù)據(jù)挖掘技術(shù),對(duì)健康樹木和患病樹木的遙感圖像數(shù)據(jù)進(jìn)行分析研究和區(qū)別分類,旨在實(shí)現(xiàn)樹木患病的檢測與預(yù)防,且有效提升森林蟲害防治的研究效率[1]。

        2研究意義

        理論意義:引人數(shù)據(jù)挖掘技術(shù),豐富森林健康管理研究方法。

        目前,關(guān)于林木健康的研究雖已取得豐碩成果,但森林健康相關(guān)的數(shù)據(jù)挖掘作為現(xiàn)實(shí)問題研究還較少。因此,本項(xiàng)目引入數(shù)據(jù)挖掘技術(shù),構(gòu)建科學(xué)有效的模型和算法,從而豐富森林健康管理的研究方法,為其提供一種新的研究視角。

        現(xiàn)實(shí)意義:為相關(guān)部門對(duì)樹木健康的檢測監(jiān)控提供參考。

        基于高分辨率遙感數(shù)據(jù),利用統(tǒng)計(jì)學(xué)相關(guān)理論知識(shí)以及數(shù)據(jù)挖掘技術(shù),對(duì)健康樹木和患病樹木的遙感圖像數(shù)據(jù)進(jìn)行分析研究和區(qū)別分類,在對(duì)森林健康的保護(hù)方面有著極其重要的現(xiàn)實(shí)意義。

        3數(shù)據(jù)導(dǎo)入與預(yù)處理

        3.1數(shù)據(jù)集加載

        本文所使用的原數(shù)來源于機(jī)器學(xué)習(xí)的加州大學(xué)數(shù)據(jù)庫UCI,本文使用的則是其中一組病樹研究數(shù)據(jù)。該數(shù)據(jù)集是來自Johnson等遙感研究的一些訓(xùn)練和測試數(shù)據(jù)的集合。該數(shù)據(jù)集由Quickbird衛(wèi)星遙感圖像分割組成,這些分割是通過分割全銳化圖像生成的,這些數(shù)據(jù)中含有快鳥衛(wèi)星遙感數(shù)據(jù)中的紋理信息以及數(shù)據(jù)的光譜信息,其數(shù)據(jù)屬性信息如表1所列。

        該數(shù)據(jù)集來自Quickbird衛(wèi)星遙感圖像。數(shù)據(jù)集中的原數(shù)據(jù)為計(jì)算過后的R,G和NIR波段的平均光譜值以及兩個(gè)常用的紋理度量,標(biāo)準(zhǔn)差和灰度共生矩陣(GLCM)表示所有方向上的信息。而B波段再次被排除在分析外,因?yàn)樗c綠色波段中信息高度相關(guān),而全色波段被用作兩種紋理計(jì)算,因?yàn)樗钤敿?xì)的空間信息。實(shí)驗(yàn)區(qū)域?yàn)榧s為3.0kmx2.5km,主要由落葉闊葉林和常綠針葉林組成,有較小面積的砍伐林、住宅和農(nóng)業(yè)用地。又因?yàn)檫@個(gè)位置有許多患病的松樹和一些其他樹種,而且該地區(qū)有許多其他類型的土地利用和土地覆蓋,從而有利于我們實(shí)驗(yàn)的對(duì)比分析。

        3.2本文進(jìn)行的數(shù)據(jù)預(yù)處理

        數(shù)據(jù)處理指的是在提取數(shù)據(jù)、模型、研究和分析原始數(shù)據(jù)集的其他活動(dòng)前需要進(jìn)行的一些處理過程。我們獲得的數(shù)據(jù)源一般都是不適合用來挖掘的。所以需要通過數(shù)據(jù)預(yù)處理使數(shù)據(jù)集變成進(jìn)行數(shù)據(jù)挖掘合適的數(shù)據(jù)[2]。

        原數(shù)據(jù)集劃分為95%的訓(xùn)練集以及5%測試集,按照習(xí)慣總數(shù)據(jù)集將按照比例6:2:2劃分為三類,分別是訓(xùn)練集、測試集、驗(yàn)證集。但在一些情況下,驗(yàn)證集并不是必要的,所以本文將原數(shù)據(jù)集合并后按照比例劃分為75%的訓(xùn)練集以及25%測試集,用于病樹檢測模型的擬合和評(píng)估檢測。

        4病樹檢測模型的建立與求解

        4.1隨機(jī)森林分類方法

        4.1.1隨機(jī)森林基本原理

        隨機(jī)森林是用于回歸與分類的一種主流集成學(xué)習(xí)方法,也是一種常見的機(jī)器學(xué)習(xí)模型。它的實(shí)質(zhì)是建立在決策樹基礎(chǔ)上的分類器集成算法,屬于Bagging類型[3]。隨機(jī)森林中單棵樹的信息增益率公式如下:

        4.1.2基于隨機(jī)森林的病樹分類

        首先,對(duì)數(shù)據(jù)集進(jìn)行一下處理,將類別變量轉(zhuǎn)換為因子型,以便接下來的分類建模工作。然后,查看自變量的重要性程度。如圖1所示。

        兩種測算方式下分別代表換掉變量后準(zhǔn)確率的降低程度和換掉變量后信息增益率的降低程度。而這兩個(gè)的數(shù)值大小,決定了變量的重要性,值越大,則表示變量越重要[4]。從圖2可以看出,Mean_Red對(duì)分類結(jié)果影響最大,是所有變量中對(duì)分類問題最重要的變量。

        在使用函數(shù)randimForest()時(shí),函數(shù)會(huì)存在默認(rèn)mtry(單棵樹的特征數(shù)量)與ntree(森林中樹的棵數(shù))。但是,現(xiàn)實(shí)中這個(gè)默認(rèn)值一般情況下都不是分類效果最好的,所以我們在構(gòu)建模型時(shí),應(yīng)該想辦法去確定最優(yōu)的參數(shù)值。

        基于逐一增加變量的方法,從輸出結(jié)果可以觀察到,當(dāng)mtry為5時(shí),模型的誤判率均值是最低的。

        在確定了最優(yōu)的mtry后,還需要進(jìn)一步確定模型中的最優(yōu)ntree。在確定該參數(shù)時(shí),我們將應(yīng)用模型的可視化分析。在之前的分析中發(fā)現(xiàn),mtry為5時(shí)模型最佳,所以接下來將建立相應(yīng)的模型,并對(duì)其進(jìn)行可視化分析。具體結(jié)果如圖3所示。

        從圖3可以得出,當(dāng)ntree大概大于450后,模型誤差便會(huì)趨于穩(wěn)定,所以我們可以將模型中的ntree大致確定為450,以此來達(dá)到最優(yōu)模型。

        綜上,在建立模型時(shí),本文嘗試了當(dāng)mtry=5,ntree=500; mtry=5,ntree=450; mtry=3,ntree=450,三種不同情況下模型建立效果。發(fā)現(xiàn)這兩個(gè)參數(shù)對(duì)分類結(jié)果影響較小。這里展示其中效果最好的mtry=5,ntree=450時(shí)的模型結(jié)果。

        如表2所列,其中預(yù)測錯(cuò)誤的僅有12個(gè)實(shí)例個(gè)數(shù),而針對(duì)患病樹木檢測正確的卻有52個(gè),正確率為99 .Ogo-/o,預(yù)測結(jié)果良好,適合作為病樹檢測分類的建模方法。接下來繪制用于評(píng)價(jià)模型優(yōu)劣的ROC曲線圖[5],如圖4所示,圖中的AUC值為0.946。

        其余兩個(gè)模型的AUC值為0.945和0.937,相對(duì)來說,模型效果區(qū)別并不大。

        4.2支持向量機(jī)分類方法

        4.2.1支持向量機(jī)基本原理

        支持向量機(jī)通常用來進(jìn)行分類,回歸分析及模式識(shí)別。自支持向量機(jī)算法大概原理提出后,20世紀(jì)90年代Vapnik等的研究成果又使得該法快速發(fā)展。由于其較高的正確率已成為解決多維數(shù)據(jù)預(yù)測的一種較受歡迎的工具,支持向量機(jī)種類不同可解決不同類型的問題。其基本原理是將分類點(diǎn)正確區(qū)分,使分隔的距離最大化,可以轉(zhuǎn)化為凸二次規(guī)劃問題來求解[6]。

        4.2.2基于支持向量機(jī)的病樹分類

        在使用R語言對(duì)支持向量機(jī)算法建模的過程中,參數(shù)type是指建立模型的類別,它可以取的值有五種,分別為:C-classification,nu-classification,one-classification,eps-regression和nu-regression。其中,前3個(gè)針對(duì)的分類方式都是字符型結(jié)果變量,而且第3種方式同時(shí)還是邏輯判別:后兩種則是針對(duì)數(shù)量型結(jié)果變量的分類方式。故根據(jù)用途的差異,我們選擇type的取值為C-classification。

        為了選擇模型最優(yōu)的核函數(shù),采用了逐一實(shí)驗(yàn)不同核函數(shù)的建模效果的方法,并進(jìn)行了比較結(jié)果,最后看預(yù)測結(jié)果最好的模型,它用什么核函數(shù),我們就用它所使用的核函數(shù)。

        觀察各種分類方式的模型預(yù)測結(jié)果,所得齊次多項(xiàng)式核函數(shù)的建模正確率為0.9669,非齊次多項(xiàng)式核函數(shù)的建模正確率為0.9521,高斯核函數(shù)的建模正確率為0.9901,雙曲正切核函數(shù)的正確率為0.9083。由此,故選擇高斯核函數(shù)作為建模核函數(shù)。最終,我們將利用C-classification與高斯核函數(shù)結(jié)合的模型作為最優(yōu)模型。并根據(jù)該模型預(yù)測,得到混淆矩陣如表3所列。

        由表3可知,其中預(yù)測錯(cuò)誤的僅有12個(gè)實(shí)例個(gè)數(shù),而針對(duì)患病樹木檢測正確的卻有48個(gè),正確率為99.01%,預(yù)測結(jié)果良好,十分適合作為病樹檢測分類的建模方法。接下來繪制用于評(píng)價(jià)模型優(yōu)劣的ROC曲線圖,結(jié)果如圖5所示,AUC值為0.913。

        5病樹檢測方法結(jié)果分析對(duì)比

        將本文所研究的兩種模型算法進(jìn)行結(jié)果對(duì)比,繪制算法結(jié)果對(duì)比表如表4所列。

        由表4可以看出,兩種算法模型結(jié)果均較好,但隨機(jī)森林算法比支持向量機(jī)算法的結(jié)果更好一點(diǎn),正確率和作為模型的評(píng)價(jià)標(biāo)準(zhǔn)的AUC值均是更優(yōu)秀的。

        猜你喜歡
        隨機(jī)森林支持向量機(jī)數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        隨機(jī)森林在棉蚜蟲害等級(jí)預(yù)測中的應(yīng)用
        基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
        軟件(2016年7期)2017-02-07 15:54:01
        拱壩變形監(jiān)測預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
        動(dòng)態(tài)場景中的視覺目標(biāo)識(shí)別方法分析
        論提高裝備故障預(yù)測準(zhǔn)確度的方法途徑
        基于熵技術(shù)的公共事業(yè)費(fèi)最優(yōu)組合預(yù)測
        基于隨機(jī)森林算法的飛機(jī)發(fā)動(dòng)機(jī)故障診斷方法的研究
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        亚洲国产av自拍一区| 欧美深夜福利视频| 日韩精品免费一区二区中文字幕| 亚洲禁区一区二区三区天美| 97久人人做人人妻人人玩精品| 色播久久人人爽人人爽人人片av| 国产黑色丝袜一区在线| 久久夜色精品国产亚洲av老牛| 国产在线观看自拍av| 欧美a级毛欧美1级a大片免费播放| 中文字幕亚洲无线码在一区| av网页在线免费观看| 一本色道久久88—综合亚洲精品 | 久久av一区二区三区黑人| 公与淑婷厨房猛烈进出| 最新国产av无码专区亚洲| 欧美在线成人免费国产| 亚洲国产精品久久久婷婷| 久久久久人妻一区精品| 国内精品视频一区二区三区| 色窝综合网| 华人在线视频精品在线| 午夜福利av无码一区二区| 偷窥村妇洗澡毛毛多| 亚洲精品中文有码字幕| 91精品亚洲成人一区二区三区| 欧美艳星nikki激情办公室| 国产亚洲第一精品| 一本色道88久久加勒比精品| 中文字幕乱码高清完整版| 亚洲av无码乱码国产麻豆穿越| 日本亚洲成人中文字幕| 漂亮人妻被强了完整版| 亚洲一本到无码av中文字幕| 国产av一区二区三区区别| 国产一区二区三区男人吃奶| 少女韩国电视剧在线观看完整| a毛片全部免费播放| 日韩av一区二区三区在线观看 | 97无码人妻一区二区三区蜜臀| 男女视频网站在线观看|