亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于無人機高光譜遙感的柑橘患病植株分類與特征波段提取

        2020-11-29 13:04:36鄧小玲曾國亮朱梓豪黃梓效楊佳誠童澤京殷獻博王天偉蘭玉彬
        華南農(nóng)業(yè)大學學報 2020年6期
        關鍵詞:分類模型

        鄧小玲,曾國亮,朱梓豪,黃梓效,楊佳誠,童澤京,殷獻博,王天偉,蘭玉彬

        (1 華南農(nóng)業(yè)大學 電子工程學院/人工智能學院,廣東 廣州 510642;2 國家精準農(nóng)業(yè)航空施藥技術國際聯(lián)合中心,廣東 廣州 510642)

        農(nóng)作物病蟲害是制約農(nóng)業(yè)生產(chǎn)發(fā)展的主要因素之一,對農(nóng)作物產(chǎn)量與品質(zhì)造成極大損失。目前柑橘Citrus reticulataBlanco產(chǎn)業(yè)的病蟲害發(fā)展趨勢逐漸惡化,其中,柑橘黃龍病(Citus Huanglongbing,HLB)最為嚴重,患黃龍病的植株會導致果實的產(chǎn)量和品質(zhì)下降,最后導致樹體死亡。美國、中國、巴西等柑橘生產(chǎn)大國都受到柑橘黃龍病的嚴重威脅[1]。到目前為止,柑橘黃龍病仍然沒有有效的治療方法,一旦發(fā)現(xiàn),只能連根拔除,以免其他健康植株被傳染。因此,如何快速、精準地找到已患黃龍病的柑橘植株成為當今柑橘病蟲害防治的首要任務[2]。傳統(tǒng)的柑橘園區(qū)病害監(jiān)測與防治主要是依靠農(nóng)戶田間走訪調(diào)查取樣,不僅耗時、耗力、效率低下,而且因人的主觀性而容易遺漏。中國未來的農(nóng)業(yè)產(chǎn)業(yè)趨向于高度區(qū)域化、智能化、一體化及精準化,依靠人工田間調(diào)查的方式顯然已經(jīng)不能滿足現(xiàn)代農(nóng)業(yè)的需求[3]。近幾年快速發(fā)展的精準農(nóng)業(yè)航空理念非常符合未來農(nóng)業(yè)的發(fā)展方向,該理念的基本思想是通過空中和地面遙感采集農(nóng)田信息,制作作業(yè)處方圖,根據(jù)處方圖實現(xiàn)精準施藥。其中低空遙感正是快速獲取柑橘園區(qū)病蟲害信息的重要解決方案之一[4]。與衛(wèi)星遙感相比,低空遙感具有成本低、快速、靈活性高、實時獲取數(shù)據(jù)等優(yōu)點,能夠在大范圍內(nèi)快速獲取空間地表信息,在農(nóng)作物病蟲害監(jiān)測領域具有不可比擬的優(yōu)勢[5]。高光譜檢測技術已經(jīng)在許多領域被應用,與可見光、多光譜圖像相比,高光譜圖像中蘊含著大量豐富的光譜信息,患病植株葉片細胞中的水分、色素、氮元素等發(fā)生變化會引起反射光譜的變化,通過分析反射光譜,可以建立農(nóng)作物病蟲害的判別模型。在柑橘黃龍病的高光譜遙感研究上,佛羅里達大學的Li等[6]是最早開展無人機遙感柑橘黃龍病的研究團隊之一,該團隊使用地面高光譜儀建立了光譜庫,并對無人機高光譜圖像進行波譜匹配識別分類,但由于獲取高光譜的拍攝條件和采集設備的差異,該方法識別準確率較低;Kumar等[7]為了實現(xiàn)柑橘黃龍病患病區(qū)域的檢測,利用多種植被指數(shù)特征和紅邊參數(shù)對無人機機載高光譜圖像和多光譜圖像進行分析,準確率也不理想,表明基于光譜庫的方法對柑橘黃龍病檢測存在一定的局限性。蘭玉彬等[8]通過無人機獲取柑橘果園的低空高光譜影像,對患黃龍病和健康的植株反射光譜進行一階微分和對數(shù)處理,并采用支持向量機和K鄰近進行建模和分類,分類的準確率達到94.7%,表明傳統(tǒng)機器學習方法能夠?qū)崿F(xiàn)無人機高光譜遙感檢測柑橘黃龍病。Lan等[9]采用SVM、集成學習等幾種機器學習算法,對經(jīng)過特征壓縮與挖掘后的健康柑橘和黃龍病感染柑橘的多光譜樣本進行建模,結果表明集成學習和神經(jīng)網(wǎng)絡算法具有很強的魯棒性和分類效果。

        通過機載高光譜相機把每一棵患柑橘黃龍病的植株準確檢測并定位出來并非易事,原因在于柑橘種植不僅僅面臨黃龍病威脅,還存在著許多其他病蟲害,如缺素、黃斑病、黃脈病等,這些病蟲害的癥狀與黃龍病極為相似,在低空遙感條件下很難準確區(qū)分[10]?;疾≈仓昱c健康植株差別較為明顯,本研究提出通過無人機高光譜遙感技術檢測出健康的柑橘植株,其余患病的植株通過人工田間調(diào)查方式判斷其患病種類及患病程度。該方式是傳統(tǒng)病蟲害監(jiān)測與現(xiàn)代遙感技術的結合,可以減少柑橘病蟲害檢測的時間和人力成本,同時確保病蟲害識別的準確性。

        1 材料與方法

        1.1 試驗地概況

        本研究在廣東省柑橘黃龍病綠色防控與新栽培模式研發(fā)示范基地進行,研究區(qū)域位于廣東省惠州市博羅縣楊村鎮(zhèn) (北緯 23°29′57.81″~23°29′59.31″,東經(jīng) 114°28′8.39″~114°28′12.26″,海拔 40 m),屬于亞熱帶季風氣候,年平均氣溫21 ℃、降水量1 932.7 mm、平均日照2 023 h、無霜期長達345 d,土地肥沃,四季如春,為柑橘等果樹的種植提供了優(yōu)越的氣候條件。

        試驗區(qū)域是患病蟲害、缺素等癥狀的高發(fā)區(qū),柑橘品種為砂糖橘,種植砂糖橘9行,植株間行距4 m,每行有30余棵植株,列距2 m,共有334棵植株。柑橘植株分為健康和患病(多數(shù)患黃龍病、缺素癥狀,少數(shù)患紅蜘蛛病害等)2類。園區(qū)的果樹由華南農(nóng)業(yè)大學農(nóng)學院柑橘研究團隊長期追蹤檢測,植株健康與否均由該團隊專家鑒定確認。

        1.2 高光譜數(shù)據(jù)采集及預處理

        1.2.1 無人機高光譜數(shù)據(jù)采集 本研究使用的無人機平臺是DJI MATRICE 600 PRO六旋翼無人機搭載DJI RONIN-MX云臺。該無人機配備6塊鋰電池(電池型號為TB47S),機臂可快速折疊,起落架可自由收放,具有便攜靈活安全的優(yōu)點,維護成本低,對起飛降落環(huán)境無特殊要求,可適應復雜的地形環(huán)境,空載質(zhì)量為9.5 kg,最大起飛質(zhì)量可達15.5 kg??蓪崿F(xiàn)最多32 min的懸停時間。滿足本試驗對大面積農(nóng)田的數(shù)據(jù)采集要求。DJI RONIN-MX云臺是專業(yè)級的三軸通用云臺系統(tǒng),適配多種型號的相機,可以完美適配搭載在MATRICE 600 PRO飛行器上進行專業(yè)航拍。

        本研究中使用S185機載高速成像儀采集高光譜數(shù)據(jù),該成像光譜儀由德國Cubert公司生產(chǎn)。S185采用畫幅式高光譜成像技術,能夠以快照式的速度進行所有光譜通道同步成像,在毫秒級時間內(nèi)獲得范圍內(nèi)的高精度高光譜圖像。S185采用了小型化設計,質(zhì)量僅500 g,其所有光譜通道同步成像的特點非常適合機載移動方式快速測量,配套軟件功能豐富,可以用于批量光譜輸出、求取植被指數(shù)、圖像分類等。S185具有非掃描式、全畫幅、快速成像的特點,光譜波長范圍在450~950 nm之間,采樣間隔為4 nm,通道數(shù)為125。

        執(zhí)行飛行任務之前,先在地面進行S185高光譜相機的標準白板輻射校正和黑板校正,在地面基站設定無人機飛行高度50 m、重疊率75%、飛行速度2 m/s。柑橘植株冠層的高光譜數(shù)據(jù)采集要求晴天無云或少云、無風或風速較小的環(huán)境。本研究數(shù)據(jù)采集時間為2017年12月9日11:00—13:00,這個時間段是高光譜數(shù)據(jù)采集的最佳時間。在飛行試驗中,由遙控器控制無人機升高至指定高度,然后按照預設定飛行路線執(zhí)行自動飛行任務。高光譜圖像數(shù)據(jù)同時儲存在單機版計算機中。

        1.2.2 高光譜圖像預處理 用S185相機采集到的數(shù)據(jù)由高光譜立體影像和全色圖像組成。預處理前,先刪除起飛、降落和飛機轉(zhuǎn)彎時拍攝的照片以及其他與研究區(qū)無關的照片,以減少不必要的數(shù)據(jù)處理,加快整體試驗進度。然后,用Cube-Pilot軟件把高光譜立體影像轉(zhuǎn)換成jpg格式,在PhotoScan中拼接高光譜影像,與拼接數(shù)碼影像的過程基本一樣。全色圖像沒有pos信息,先拼接全色影像;在進行照片對齊、建立密集點云、生成網(wǎng)格、生成紋理等操作后,全色圖像的拼接完成;更改路徑,在全色圖像的基礎上替換數(shù)據(jù),最后導出全景正射影像。高光譜圖像拼接完成后,使用ENVI軟件進行高光譜影像柑橘植株冠層的平均光譜提取。華南農(nóng)業(yè)大學農(nóng)學院柑橘研究團隊已在研究區(qū)標記出完全健康植株、患黃龍病植株、缺素植株和其他患病植株,所有植株分為2類:有標記的植株為患病植株(黃龍病、缺素);沒有標記的植株為完全健康植株(圖1)。

        圖1 試驗區(qū)域及樣本標注Fig. 1 Experiment area and sample marking

        使用感興趣區(qū)域(Regoin of interest,ROI)提取工具選擇ROI并提取其平均光譜。對所選取的柑橘植株冠層隨機繪制10個ROI,每個ROI為3×3的像素矩陣,通過ENVI解譯每個ROI的光譜曲線,把一個ROI當做一個樣本點,通過ENVI均化處理每個ROI的光譜值,把得到的每個ROI的平均光譜作為在該樣本點的光譜,得到各樣本點的光譜數(shù)據(jù)。導出所有光譜數(shù)據(jù),按照健康植株與患病植株歸類。最后得到3 400條光譜數(shù)據(jù)。

        1.3 特征工程

        1.3.1 異常數(shù)據(jù)剔除 數(shù)據(jù)是科學研究中的最基礎的資源,數(shù)據(jù)質(zhì)量的優(yōu)劣直接影響以此作為依據(jù)的試驗研究正確性和科學性。在實際應用中,異常數(shù)據(jù)一般是因為各種客觀因素或人為過失產(chǎn)生的,異常數(shù)據(jù)的出現(xiàn)會極大程度地降低數(shù)據(jù)集的質(zhì)量,導致在這些異常數(shù)據(jù)中學習到錯誤的特征,以至于最后的分類效果不理想。本研究中異常數(shù)據(jù)出現(xiàn)的原因有:1)高光譜圖像數(shù)據(jù)的采集需要穩(wěn)定的光照條件,若采集數(shù)據(jù)過程中出現(xiàn)云層,太陽光照強度變?nèi)?,導致光線在植株冠層上的反射率變低,從而出現(xiàn)異常數(shù)據(jù);2)無人機在飛行過程中,因環(huán)境(風)、轉(zhuǎn)向、變速等因素,使得相機在拍攝過程中出現(xiàn)抖動,相機拍攝角度發(fā)生改變,導致出現(xiàn)異常光譜數(shù)據(jù);3)由于提取平均光譜的過程需要手動操作,選取的區(qū)域可能是圖像拼接時的接合處或者是與柑橘植株較為相似的雜草等,導致光譜數(shù)據(jù)異常。

        本研究使用OneClassSVM算法剔除異常數(shù)據(jù)。OneClassSVM是一個單樣本檢測算法,常被用于異常數(shù)據(jù)的檢測,屬于支持向量機家族的算法,它與傳統(tǒng)的分類回歸支持向量機的區(qū)別是采用了無監(jiān)督學習的方法[11]。原本線性不可分的數(shù)據(jù),通過核函數(shù)將數(shù)據(jù)映射至更高維空間里,變成線性可分,且在數(shù)據(jù)點間找一個分割超平面使支持向量間隔最大[12]。經(jīng)過數(shù)據(jù)清洗過程,共剔除異常樣本419個,最后剩余有效的健康植株高光譜樣本數(shù)據(jù)2 474個、患病樣本數(shù)據(jù)507個。

        1.3.2 過采樣處理 在訓練二分類模型時,經(jīng)常會遇到正負樣本比例不均衡問題。例如,癌癥病人診斷樣本,正負(患癌與健康)樣本比例達到1∶99,若分類器把所有樣本都判斷為健康樣本,模型的正確率達到99%。然而,模型的目的是找到患癌的樣本,這顯然沒有達到我們期望的效果。如果采用原來的不均衡樣本進行訓練,算法都會存在類似的問題。過采樣是針對數(shù)據(jù)不均衡問題的最佳解決辦法之一,隨機過采樣是從少數(shù)類樣本中又放回(隨機重復)抽取樣本以擴增少數(shù)類樣本數(shù)量從而均衡正負樣本比例,該方法對少數(shù)類樣本進行了多次重復取樣,雖然擴大了少數(shù)類數(shù)據(jù)規(guī)模,但會造成過擬合。因此需要采用一些方法生成新的樣本。SMOTE(Synthetic minority oversampling technique)算法[13]合成了少數(shù)類過采樣技術,其基本原理是對少數(shù)類集中的每個樣本xi,從xi在少數(shù)類集中的K近鄰中選一個樣本,然后在xi和的連線上隨機選取一個點作為合成的新樣本,其公式為:

        式中,xnew表示新合成的樣本,xi表示隨機選取的樣本,表示xi的近鄰樣本,r and(0,1)表示在(0,1)之間隨機選取隨機數(shù)。

        采用SMOTE算法對測試集樣本進行1∶1過采樣,最后得出正負樣本各1 974個,其中,生成負類樣本1 567個。

        1.3.3 特征波長提取 高光譜數(shù)據(jù)的數(shù)據(jù)量大、波段信息豐富,可以解決很多在多光譜數(shù)據(jù)中不能解決的分類問題,但波段間的相關性過大且具有大量冗余信息,這為實際應用帶來海量數(shù)據(jù)存儲和處理的難題。本次試驗的光譜數(shù)據(jù)有125個波段,采用全波段建立判別模型,每個波段均作為一個特征影響模型的訓練結果,但是,并不是所有波長都對柑橘植株病蟲害敏感,需要針對柑橘植株病蟲害按照一定的判定標準選擇出一個最優(yōu)的波段組合,該波段組合需要保留原始高光譜數(shù)據(jù)的主要特征。因此,需要對光譜數(shù)據(jù)進行初步壓縮,剔除不敏感的、冗余的波段,使數(shù)據(jù)維度降低,以減少運算的復雜度并降低分類模型的復雜度[14]。同時為后續(xù)在實際應用中定制柑橘植株病蟲害專屬波段的多光譜相機提供理論依據(jù)。

        連續(xù)投影算法(Successive projections algorithm,SPA)是一種新興的波段提取方法,能夠消除大量波長變量之間的共線影響、減少模型復雜度,可以消除光譜矩陣間的冗余信息,被廣泛應用于光譜計量學、醫(yī)學成像、信號處理等領域[15]。SPA是一種前向迭代選擇方法,其基本原理是任選一個波長計算它在未選入的波長上的投影,將投影向量最大的波長加入波長鏈中,循環(huán)N次,每個被選入的波長都與前一個被選入波長的線性關系最小[16]。連續(xù)投影算法在數(shù)據(jù)分析軟件Matlab中實現(xiàn),波段選取的評價指標為均方根誤差(Root mean square error,RMSE),RMSE是觀測值與真值偏差的平方和與觀測次數(shù)比值的平方根,用于衡量觀測值與真值之間的偏差。

        1.4 模型的建立與評價

        本研究基于全波段數(shù)據(jù)使用BP神經(jīng)網(wǎng)絡和XgBoost算法[17],以及特征波段的邏輯回歸(LR)和支持向量機(SVM)算法,分別建立柑橘健康植株分類模型,并進行比較分析,圖2為特征工程技術路線圖。

        圖2 特征工程技術路線圖Fig. 2 The technology roadmap of feature engineering

        BP神經(jīng)網(wǎng)絡是一種多層前向神經(jīng)網(wǎng)絡,全稱為反向傳播網(wǎng)絡。其基本過程分為權值參數(shù)正向傳播以及誤差反向傳播。每次更新連接權僅針對一個訓練樣本,這樣的算法需要進行多次迭代,在訓練集較大時,標準BP神經(jīng)網(wǎng)絡會獲得較好的解。BP神經(jīng)網(wǎng)絡具有優(yōu)秀的表達能力,但亦有很多顯而易見的缺點,如容易陷入局部最小點、收斂速度慢、網(wǎng)絡結構不易確定。XgBoost算法對梯度提升決策樹(Gradient boosting decision tree, GBDT)進行了改進,是GBDT的工程實現(xiàn)。它的閃光點在于支持并行化,在樹成型最耗時的階段,對某個節(jié)點內(nèi)選擇最佳分裂點,候選分裂點計算增益時用多線程并行,使訓練速度大大加快。在全波段高光譜數(shù)據(jù)這種分布稠密的數(shù)據(jù)集上,XgBoost算法往往能得出非常優(yōu)秀的泛化效果和表達效果、自動發(fā)現(xiàn)特征之間的高階關系,而且不需要對數(shù)據(jù)進行特殊的預處理(標準化、歸一化等),具有較好的魯棒性和解釋性。

        LR是機器學習領域最常用也是最基礎的二分類算法,能通過未知類別對象的屬性特征序列得到對象所處的類別。LR在數(shù)據(jù)集線性分布時具有很優(yōu)秀的分類效果。SVM是機器學習中用來解決二分類問題的監(jiān)督學習算法,對于高維、非線性的數(shù)據(jù)問題有良好的分類能力。引入核函數(shù)能夠避免高維變換帶來的計算復雜性,常用的核函數(shù)包括線性核函數(shù)(Linear kernel function)、徑向基核函數(shù)(RBF kernel function)和多項式核函數(shù)(Polynomial kernel function)。

        針對不同的問題需要使用不同的模型評價標準,一般有 Accuracy、Precision、Recall、F1、ROC(Receiver operating characteristic)曲線和AUC(Area under curve)等幾種,前4種分別由混淆矩陣計算得出。具體公式如下:

        式中,ACC(Accuracy)表示分類準確度,TP(True positive)表示被模型預測為正的正樣本,TN(True negative)表示被模型預測為負的負樣本,F(xiàn)P(False positive)表示被模型預測為正的負樣本,F(xiàn)N(False negative)表示被模型預測為負的正樣本。

        ROC起源于二戰(zhàn)中敵機檢測的雷達信號分析技術,計算出2個重要量的值作為橫、縱坐標作圖,得到了ROC曲線。在機器學習中,ROC曲線的縱坐標是真正率(True positive rate, TPR),橫坐標是假正率(False positive rate, FPR)。AUC被定義為ROC曲線下的面積,即對ROC曲線求積分,其值介于0.5~1.0之間,AUC的值越大表示該模型分類效果越好。計算公式如下:

        由于測試集數(shù)據(jù)沒有經(jīng)過過采樣算法處理,測試集仍是不均衡數(shù)據(jù)集。在不均衡數(shù)據(jù)集分類算法的評估中,ACC這一評估標準無法準確地反映少數(shù)類的分類效果,將不再適用于本試驗。而在本研究應用中的目標是要盡可能找出所有的患病樣本,寧可誤判,但不能漏判。召回率反映模型的容錯性,因此在本研究中召回率評分是最重要的一個指標。

        1.5 數(shù)據(jù)集設置

        本研究基于全波段數(shù)據(jù)使用BP神經(jīng)網(wǎng)絡和XgBoost算法,基于特征波段使用邏輯回歸和支持向量機算法建立健康植株與患病植株的分類模型。為了方便比較模型的效果,需要統(tǒng)一測試集數(shù)據(jù)。訓練集與測試集的設置如下:

        本數(shù)據(jù)集共有2 981個數(shù)據(jù),其中,正類(健康樣本)2 474個、負類(患病樣本)507個,屬于不均衡樣本集。第1步,按一定比例隨機抽選出一部分樣本作為測試集(正類樣本500個、負類樣本100個),其余數(shù)據(jù)為訓練集(正類樣本1 974個、負類樣本407個);第2步,將訓練集分為多數(shù)類子集(正類)和少數(shù)類子集(負類),然后通過過采樣算法增加少數(shù)類子集的樣本數(shù)據(jù)量,過采樣后的少數(shù)類子集和多數(shù)類子集組成新的數(shù)據(jù)集,此時數(shù)據(jù)集為均衡數(shù)據(jù)集,不均衡數(shù)據(jù)樣本處理流程見圖3。最終,訓練集樣本共有4 948個,其中,健康樣本與患病樣本各2 474個;測試集樣本共600個,其中,健康樣本500個、患病樣本100個。

        圖3 不均衡數(shù)據(jù)樣本處理流程Fig. 3 The flow diagram of processing unbalanced data samples

        2 結果與分析

        2.1 特征波長數(shù)的最優(yōu)結果

        圖4為連續(xù)投影算法的均方根誤差曲線(RMSE)。由圖4可見,特征波長數(shù)為4時RMSE最小,因特征波長提取的目的是為了更好地實現(xiàn)健康植株與患病植株的分類,因此應該選取盡量少的特征波長[18]。特征波長數(shù)為2時的RMSE為0.518 05,與特征波長數(shù)為4時的RMSE相差較小,因此選擇2個特征波長作為最優(yōu)結果。選出來的特征波段是本數(shù)據(jù)集中的第61、78個特征波段,即698和762 nm是連續(xù)投影算法選出來的對健康植株分類結果貢獻值最大的特征波長(圖5)。

        圖4 均方根誤差(RMSE)曲線圖Fig. 4 The curve of root mean square error(RMSE)

        圖5 特征波段示意圖Fig. 5 Schematic diagram of feature band

        2.2 基于全波段的柑橘患病植株分類結果

        2.2.1 BP神經(jīng)網(wǎng)絡 本次試驗使用4層網(wǎng)絡結構,包括1層輸入層、2層隱含層和1層輸出層,神經(jīng)網(wǎng)絡結構見表1。訓練時設置損失函數(shù),使用交叉熵代價函數(shù)(Cross-entropy cost function),令epoch=50,batch_size=100,即每批參加訓練的樣本大小為100,一次epoch的意思是把所有訓練樣本都在神經(jīng)網(wǎng)絡中進行正向傳播和反向傳播。由表1可見,模型的輸入層為波段數(shù)(輸入節(jié)點數(shù))125的光譜曲線向量,前3層均使用ReLu激活函數(shù),ReLu函數(shù)具有非飽和性,可以很好地解決梯度消失問題;模型輸出層的輸出節(jié)點數(shù)為2,把樣本分為健康與患病兩類,使用Sigmoid激活函數(shù)。

        表1 BP神經(jīng)網(wǎng)絡結構Table 1 The structure of BP neural network

        2.2.2 XgBoost 由于XgBoost模型的參數(shù)較多,因此優(yōu)化模型參數(shù)步驟是必要的,合適的參數(shù)能使模型泛化能力最大化。其中,num_round(樹的數(shù)量)和eta(學習率)是最終需要的參數(shù),對模型效果影響較大。一般XgBoost參數(shù)調(diào)優(yōu)步驟需要先通過網(wǎng)格搜索先找出num_round和eta的最佳取值,再調(diào)整其他參數(shù)。XgBoost模型在經(jīng)過參數(shù)優(yōu)化后,得出的最優(yōu)模型參數(shù)為:num_round=40,eta=0.06,max_depth=7,min_child_weight=3,subsample=0.6,alpha=0.125。模型在測試集上的分類結果見表2。如表2所示,測試集600個樣本中,使用BP神經(jīng)網(wǎng)絡和XgBoost模型正確分類的樣本數(shù)達到500個以上,但是對患病樣本的分類準確率偏低。

        2.3 基于特征波段的分類模型及效果

        將高光譜數(shù)據(jù)中的冗余波長數(shù)據(jù)剔除,只留下特征波長對應的數(shù)據(jù)。由于對原數(shù)據(jù)集進行了特征波長提取操作,因此,需要對特征波長數(shù)據(jù)集重新進行異常數(shù)據(jù)剔除和重采樣操作。上述操作后,最終得到訓練樣本共4 016個(健康與患病樣本各2 008個),測試樣本共600個(健康樣本500個、患病樣本100個)。預處理同“1.3”,將訓練集輸入LR和SVM中,得出分類模型,使用測試集數(shù)據(jù)驗證模型準確度,結果見表3。由表3可見,測試集在特征波長下LR與SVM模型分類結果對患病樣本的分類正確率較高,但對于健康樣本的分類效果不佳。

        表2 BP神經(jīng)網(wǎng)絡和XgBoost測試結果(混淆矩陣)Table 2 The test results of BP neural network and XgBoost (Confusion matrix)

        表3 特征波長下LR和SVM分類結果(混淆矩陣)Table 3 The results of LR and SVM test bases of feature bands(Confusion matrix)

        2.4 模型效果評估對比

        統(tǒng)計BP神經(jīng)網(wǎng)絡、XgBoost、LR和SVM 4個模型在測試集數(shù)據(jù)中的分類結果,并計算出評價指標,得分結果見表4。由表4可見,BP神經(jīng)網(wǎng)絡模型AUC得分為0.883 0;100個患病樣本中有78個樣本預測正確,剩余22個樣本預測錯誤,召回率(Recall)只有78.00%,效果不理想;而500個健康樣本中預測正確的有493個,錯判率很低。XgBoost模型的AUC得分為0.912 0,且在我們最關注的指標—召回率中,XgBoost模型有更好的效果,其召回率為85.00%?;谌ǘ蔚腂P神經(jīng)網(wǎng)絡和XgBoost模型的分類準確率(ACC)均超過95%。本文的研究目的是為了盡可能找出全部的患病樣本,要求召回率盡可能高,因此,基于全波段的BP神經(jīng)網(wǎng)絡和XgBoost模型均未達到研究要求。

        表4 4種模型評估得分Table 4 The evaluation scores of four models

        使用基于特征波長的LR和SVM分類模型對患病樣本的召回率分別為93.00%和96.00%,分類準確率分別為91.50%和89.16%,均比XgBoost的分類準確率(85.00%)高,基本達到本研究的要求;但在健康樣本分類上,準確率相對低了一點。LR和SVM分類模型的AUC值分別為0.921 0和0.919 0,均高于全波段數(shù)據(jù)建模的BP神經(jīng)網(wǎng)絡和XgBoost模型的AUC值,究其原因,全波段數(shù)據(jù)信息量較大,其中很多波段信息皆為冗余波長,不僅不能提升模型效果,甚至對分類結果有干擾作用[19];而基于特征波段的建模方法只需使用簡單的邏輯回歸模型就能達到很不錯的效果。本研究通過連續(xù)投影算法篩選出的特征波長698和762 nm對柑橘患病植株分類敏感且有效。

        3 結論

        本文以柑橘植株為對象,在廣東省惠州市博羅縣楊村鎮(zhèn)柑橘黃龍病綠色防控與新栽培模式研發(fā)示范基地,利用多旋翼無人機(大疆M600 PRO)作為遙感平臺搭載高光譜成像儀(S185),采集柑橘植株冠層的高光譜遙感圖像,通過ENVI軟件提取平均光譜作為原始數(shù)據(jù),先后經(jīng)過數(shù)據(jù)清洗、過采樣等數(shù)據(jù)預處理操作,使得原來離散、不均衡的高光譜數(shù)據(jù)變得規(guī)范,便于建模分析。采用連續(xù)投影算法提取特征波長,基于全波段的BP神經(jīng)網(wǎng)絡算法、基于全波段的XgBoost算法、基于特征波段的邏輯回歸算法和支持向量機算法建立了健康柑橘植株與患病(患黃龍病、缺素)植株的分類模型,4種模型均得到不錯的分類效果,基于全波段使用BP神經(jīng)網(wǎng)絡和XgBoost算法建立的分類模型AUC值分別是0.883 0和0.912 0,分類準確率均超過95%;基于特征波段使用邏輯回歸和支持向量機算法建立分類模型,召回率(患病樣本的分類準確率)分別達到了93.00%和96.00%,證明了特征波長組合的有效性。本研究結果可為柑橘種植園的病蟲害監(jiān)測和精準防治提供一定的數(shù)據(jù)和理論支撐。

        猜你喜歡
        分類模型
        一半模型
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        分類討論求坐標
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        成人偷拍自拍视频在线观看 | 国产一区二区三区成人av | 国产老熟女网站| 99re热这里只有精品最新| 国产精品国产午夜免费福利看| 亚洲一区二区三区免费的视频| 无码精品一区二区三区在线| 日本不卡一区二区三区在线| 国产成人av一区二区三区| 在线中文字幕有码中文| 日本一区二区三区小视频| 日本九州不卡久久精品一区| 品色堂永远免费| 国际无码精品| 国产三级自拍视频在线| 蜜臀av毛片一区二区三区| 一夲道无码人妻精品一区二区 | 国产免费久久精品国产传媒| 国产精品美女久久久久浪潮AVⅤ| 国内精品国产三级国产| 高潮潮喷奶水飞溅视频无码| 亚洲欧美成人a∨| 日本人妻伦理片在线观看| 亚洲中文字幕精品乱码2021| 亚洲老妈激情一区二区三区 | 国产精品久久久亚洲第一牛牛| 国产一区二区三区小向美奈子| 国产成人精品日本亚洲专区61| 日韩精品无码久久久久久 | 香蕉视频一级片| 日韩精品一级在线视频| 男人国产av天堂www麻豆| 精品国产一区二区三区av 性色| av草草久久久久久久久久久| 中文字幕综合一区二区三区| 亚欧美日韩香蕉在线播放视频| 欧美成人久久久| av男人的天堂第三区| 日本丰满熟妇videossexhd| 亚洲一区二区三区偷拍女厕| 西西少妇一区二区三区精品|