亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林和支持向量機(jī)的森林健康情況分析

        2023-01-14 09:52:10岳麗婭鄧潔瑩梁霄
        關(guān)鍵詞:隨機(jī)森林支持向量機(jī)數(shù)據(jù)挖掘

        岳麗婭 鄧潔瑩 梁霄

        關(guān)鍵詞:數(shù)據(jù)挖掘;患病樹木檢測;隨機(jī)森林;支持向量機(jī)

        1引言

        如今,林木健康問題已得到社會(huì)各界前所未有的關(guān)注,而中國傳統(tǒng)的樣地檢測和受控實(shí)驗(yàn)等方法需要耗費(fèi)大量人力物力,且得出具體結(jié)論所需時(shí)間往往較長,使林業(yè)健康檢測喪失時(shí)效性。故傳統(tǒng)手段具有一定局限性。而遙感是避免接觸,目標(biāo)距離較遠(yuǎn)的一種探測技術(shù),其能夠?yàn)檠芯咳藛T提供更高緯度的視野,可以有效收集并且處理復(fù)雜時(shí)空維度下的海量信息。本項(xiàng)目基于高分辨率遙感數(shù)據(jù),結(jié)合統(tǒng)計(jì)學(xué)相關(guān)理論知識以及新興的數(shù)據(jù)挖掘技術(shù),對健康樹木和患病樹木的遙感圖像數(shù)據(jù)進(jìn)行分析研究和區(qū)別分類,旨在實(shí)現(xiàn)樹木患病的檢測與預(yù)防,且有效提升森林蟲害防治的研究效率[1]。

        2研究意義

        理論意義:引人數(shù)據(jù)挖掘技術(shù),豐富森林健康管理研究方法。

        目前,關(guān)于林木健康的研究雖已取得豐碩成果,但森林健康相關(guān)的數(shù)據(jù)挖掘作為現(xiàn)實(shí)問題研究還較少。因此,本項(xiàng)目引入數(shù)據(jù)挖掘技術(shù),構(gòu)建科學(xué)有效的模型和算法,從而豐富森林健康管理的研究方法,為其提供一種新的研究視角。

        現(xiàn)實(shí)意義:為相關(guān)部門對樹木健康的檢測監(jiān)控提供參考。

        基于高分辨率遙感數(shù)據(jù),利用統(tǒng)計(jì)學(xué)相關(guān)理論知識以及數(shù)據(jù)挖掘技術(shù),對健康樹木和患病樹木的遙感圖像數(shù)據(jù)進(jìn)行分析研究和區(qū)別分類,在對森林健康的保護(hù)方面有著極其重要的現(xiàn)實(shí)意義。

        3數(shù)據(jù)導(dǎo)入與預(yù)處理

        3.1數(shù)據(jù)集加載

        本文所使用的原數(shù)來源于機(jī)器學(xué)習(xí)的加州大學(xué)數(shù)據(jù)庫UCI,本文使用的則是其中一組病樹研究數(shù)據(jù)。該數(shù)據(jù)集是來自Johnson等遙感研究的一些訓(xùn)練和測試數(shù)據(jù)的集合。該數(shù)據(jù)集由Quickbird衛(wèi)星遙感圖像分割組成,這些分割是通過分割全銳化圖像生成的,這些數(shù)據(jù)中含有快鳥衛(wèi)星遙感數(shù)據(jù)中的紋理信息以及數(shù)據(jù)的光譜信息,其數(shù)據(jù)屬性信息如表1所列。

        該數(shù)據(jù)集來自Quickbird衛(wèi)星遙感圖像。數(shù)據(jù)集中的原數(shù)據(jù)為計(jì)算過后的R,G和NIR波段的平均光譜值以及兩個(gè)常用的紋理度量,標(biāo)準(zhǔn)差和灰度共生矩陣(GLCM)表示所有方向上的信息。而B波段再次被排除在分析外,因?yàn)樗c綠色波段中信息高度相關(guān),而全色波段被用作兩種紋理計(jì)算,因?yàn)樗钤敿?xì)的空間信息。實(shí)驗(yàn)區(qū)域?yàn)榧s為3.0kmx2.5km,主要由落葉闊葉林和常綠針葉林組成,有較小面積的砍伐林、住宅和農(nóng)業(yè)用地。又因?yàn)檫@個(gè)位置有許多患病的松樹和一些其他樹種,而且該地區(qū)有許多其他類型的土地利用和土地覆蓋,從而有利于我們實(shí)驗(yàn)的對比分析。

        3.2本文進(jìn)行的數(shù)據(jù)預(yù)處理

        數(shù)據(jù)處理指的是在提取數(shù)據(jù)、模型、研究和分析原始數(shù)據(jù)集的其他活動(dòng)前需要進(jìn)行的一些處理過程。我們獲得的數(shù)據(jù)源一般都是不適合用來挖掘的。所以需要通過數(shù)據(jù)預(yù)處理使數(shù)據(jù)集變成進(jìn)行數(shù)據(jù)挖掘合適的數(shù)據(jù)[2]。

        原數(shù)據(jù)集劃分為95%的訓(xùn)練集以及5%測試集,按照習(xí)慣總數(shù)據(jù)集將按照比例6:2:2劃分為三類,分別是訓(xùn)練集、測試集、驗(yàn)證集。但在一些情況下,驗(yàn)證集并不是必要的,所以本文將原數(shù)據(jù)集合并后按照比例劃分為75%的訓(xùn)練集以及25%測試集,用于病樹檢測模型的擬合和評估檢測。

        4病樹檢測模型的建立與求解

        4.1隨機(jī)森林分類方法

        4.1.1隨機(jī)森林基本原理

        隨機(jī)森林是用于回歸與分類的一種主流集成學(xué)習(xí)方法,也是一種常見的機(jī)器學(xué)習(xí)模型。它的實(shí)質(zhì)是建立在決策樹基礎(chǔ)上的分類器集成算法,屬于Bagging類型[3]。隨機(jī)森林中單棵樹的信息增益率公式如下:

        4.1.2基于隨機(jī)森林的病樹分類

        首先,對數(shù)據(jù)集進(jìn)行一下處理,將類別變量轉(zhuǎn)換為因子型,以便接下來的分類建模工作。然后,查看自變量的重要性程度。如圖1所示。

        兩種測算方式下分別代表換掉變量后準(zhǔn)確率的降低程度和換掉變量后信息增益率的降低程度。而這兩個(gè)的數(shù)值大小,決定了變量的重要性,值越大,則表示變量越重要[4]。從圖2可以看出,Mean_Red對分類結(jié)果影響最大,是所有變量中對分類問題最重要的變量。

        在使用函數(shù)randimForest()時(shí),函數(shù)會(huì)存在默認(rèn)mtry(單棵樹的特征數(shù)量)與ntree(森林中樹的棵數(shù))。但是,現(xiàn)實(shí)中這個(gè)默認(rèn)值一般情況下都不是分類效果最好的,所以我們在構(gòu)建模型時(shí),應(yīng)該想辦法去確定最優(yōu)的參數(shù)值。

        基于逐一增加變量的方法,從輸出結(jié)果可以觀察到,當(dāng)mtry為5時(shí),模型的誤判率均值是最低的。

        在確定了最優(yōu)的mtry后,還需要進(jìn)一步確定模型中的最優(yōu)ntree。在確定該參數(shù)時(shí),我們將應(yīng)用模型的可視化分析。在之前的分析中發(fā)現(xiàn),mtry為5時(shí)模型最佳,所以接下來將建立相應(yīng)的模型,并對其進(jìn)行可視化分析。具體結(jié)果如圖3所示。

        從圖3可以得出,當(dāng)ntree大概大于450后,模型誤差便會(huì)趨于穩(wěn)定,所以我們可以將模型中的ntree大致確定為450,以此來達(dá)到最優(yōu)模型。

        綜上,在建立模型時(shí),本文嘗試了當(dāng)mtry=5,ntree=500; mtry=5,ntree=450; mtry=3,ntree=450,三種不同情況下模型建立效果。發(fā)現(xiàn)這兩個(gè)參數(shù)對分類結(jié)果影響較小。這里展示其中效果最好的mtry=5,ntree=450時(shí)的模型結(jié)果。

        如表2所列,其中預(yù)測錯(cuò)誤的僅有12個(gè)實(shí)例個(gè)數(shù),而針對患病樹木檢測正確的卻有52個(gè),正確率為99 .Ogo-/o,預(yù)測結(jié)果良好,適合作為病樹檢測分類的建模方法。接下來繪制用于評價(jià)模型優(yōu)劣的ROC曲線圖[5],如圖4所示,圖中的AUC值為0.946。

        其余兩個(gè)模型的AUC值為0.945和0.937,相對來說,模型效果區(qū)別并不大。

        4.2支持向量機(jī)分類方法

        4.2.1支持向量機(jī)基本原理

        支持向量機(jī)通常用來進(jìn)行分類,回歸分析及模式識別。自支持向量機(jī)算法大概原理提出后,20世紀(jì)90年代Vapnik等的研究成果又使得該法快速發(fā)展。由于其較高的正確率已成為解決多維數(shù)據(jù)預(yù)測的一種較受歡迎的工具,支持向量機(jī)種類不同可解決不同類型的問題。其基本原理是將分類點(diǎn)正確區(qū)分,使分隔的距離最大化,可以轉(zhuǎn)化為凸二次規(guī)劃問題來求解[6]。

        4.2.2基于支持向量機(jī)的病樹分類

        在使用R語言對支持向量機(jī)算法建模的過程中,參數(shù)type是指建立模型的類別,它可以取的值有五種,分別為:C-classification,nu-classification,one-classification,eps-regression和nu-regression。其中,前3個(gè)針對的分類方式都是字符型結(jié)果變量,而且第3種方式同時(shí)還是邏輯判別:后兩種則是針對數(shù)量型結(jié)果變量的分類方式。故根據(jù)用途的差異,我們選擇type的取值為C-classification。

        為了選擇模型最優(yōu)的核函數(shù),采用了逐一實(shí)驗(yàn)不同核函數(shù)的建模效果的方法,并進(jìn)行了比較結(jié)果,最后看預(yù)測結(jié)果最好的模型,它用什么核函數(shù),我們就用它所使用的核函數(shù)。

        觀察各種分類方式的模型預(yù)測結(jié)果,所得齊次多項(xiàng)式核函數(shù)的建模正確率為0.9669,非齊次多項(xiàng)式核函數(shù)的建模正確率為0.9521,高斯核函數(shù)的建模正確率為0.9901,雙曲正切核函數(shù)的正確率為0.9083。由此,故選擇高斯核函數(shù)作為建模核函數(shù)。最終,我們將利用C-classification與高斯核函數(shù)結(jié)合的模型作為最優(yōu)模型。并根據(jù)該模型預(yù)測,得到混淆矩陣如表3所列。

        由表3可知,其中預(yù)測錯(cuò)誤的僅有12個(gè)實(shí)例個(gè)數(shù),而針對患病樹木檢測正確的卻有48個(gè),正確率為99.01%,預(yù)測結(jié)果良好,十分適合作為病樹檢測分類的建模方法。接下來繪制用于評價(jià)模型優(yōu)劣的ROC曲線圖,結(jié)果如圖5所示,AUC值為0.913。

        5病樹檢測方法結(jié)果分析對比

        將本文所研究的兩種模型算法進(jìn)行結(jié)果對比,繪制算法結(jié)果對比表如表4所列。

        由表4可以看出,兩種算法模型結(jié)果均較好,但隨機(jī)森林算法比支持向量機(jī)算法的結(jié)果更好一點(diǎn),正確率和作為模型的評價(jià)標(biāo)準(zhǔn)的AUC值均是更優(yōu)秀的。

        猜你喜歡
        隨機(jī)森林支持向量機(jī)數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        隨機(jī)森林在棉蚜蟲害等級預(yù)測中的應(yīng)用
        基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
        軟件(2016年7期)2017-02-07 15:54:01
        拱壩變形監(jiān)測預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
        動(dòng)態(tài)場景中的視覺目標(biāo)識別方法分析
        論提高裝備故障預(yù)測準(zhǔn)確度的方法途徑
        基于熵技術(shù)的公共事業(yè)費(fèi)最優(yōu)組合預(yù)測
        基于隨機(jī)森林算法的飛機(jī)發(fā)動(dòng)機(jī)故障診斷方法的研究
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        精品国产乱码一区二区三区| 国产 国语对白 露脸| 97cp在线视频免费观看| 麻豆精品一区二区综合av| 亚洲中文字幕人妻av在线| 2019nv天堂香蕉在线观看| 国产精品无码一区二区三区电影| 最近中文字幕免费完整版| 国产成人无码免费视频在线| 亚洲国产av导航第一福利网| 中文字幕一区二区三区久久网站 | 精品久久久久久国产| 97SE亚洲国产综合自在线不卡| 亚洲精品综合色区二区| 国产精品女同一区二区久| 91九色精品日韩内射无| 日日麻批免费高清视频| 男女真人后进式猛烈视频网站 | 国产乱淫h侵犯在线观看| 国产日产在线视频一区| 人人妻人人澡人人爽国产| а√中文在线资源库| 成人片黄网站色大片免费观看cn| 内射后入在线观看一区| 揄拍成人国产精品视频肥熟女| 一本色道久久综合狠狠躁中文| 国产麻豆一区二区三区在线播放| 日韩精品人妻视频一区二区三区| 亚洲乱码av乱码国产精品| 成年丰满熟妇午夜免费视频 | 北岛玲中文字幕人妻系列 | 国产精品亚洲二区在线观看| 大地资源中文第三页| 喷潮出白浆视频在线观看| 中文字幕亚洲高清精品一区在线| 日本一二三区免费在线| 一本色道无码不卡在线观看| 亚洲av无码片vr一区二区三区| 夜夜躁狠狠躁2021| 综合五月网| 狠狠色欧美亚洲综合色黑a|