亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進分離閾值特征優(yōu)選的秋季作物遙感分類

        2021-03-20 08:01:56王庚澤靳海亮顧曉鶴楊貴軍馮海寬
        農(nóng)業(yè)機械學報 2021年2期
        關(guān)鍵詞:重要性分類特征

        王庚澤 靳海亮 顧曉鶴 楊貴軍 馮海寬 孫 乾

        (1.河南理工大學測繪與國土信息工程學院, 焦作 454000;2.北京農(nóng)業(yè)信息技術(shù)研究中心農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)遙感機理與定量遙感重點實驗室, 北京 100097;3.國家農(nóng)業(yè)信息化工程技術(shù)研究中心, 北京 100097; 4.北京市農(nóng)業(yè)物聯(lián)網(wǎng)工程技術(shù)研究中心, 北京 100097)

        0 引言

        快速準確獲取農(nóng)作物種植面積是農(nóng)情監(jiān)測、農(nóng)業(yè)種植結(jié)構(gòu)調(diào)整和農(nóng)業(yè)經(jīng)濟政策制定的重要基礎數(shù)據(jù)[1-3]。傳統(tǒng)的逐級上報和抽樣調(diào)查方法,具有一定的主觀因素,費時費力、時效性差。利用遙感技術(shù)可以及時、準確、客觀、快速獲取大范圍農(nóng)作物的分布,是目前農(nóng)業(yè)遙感的研究熱點之一[4-5]。然而,農(nóng)作物之間光譜相似,具有“同物異譜、異物同譜”現(xiàn)象。尤其秋季作物的種植結(jié)構(gòu)復雜、種植周期相同、生育期較短,同時受秋季云雨天氣較多和衛(wèi)星回訪周期影響,難以獲得高質(zhì)量和最佳物候期的遙感數(shù)據(jù)[6]。目前,國內(nèi)外學者主要從時相、特征以及分類方法等角度進行了大量研究[3]。

        隨著模式識別技術(shù)在遙感圖像分類方面的應用,國內(nèi)外學者一直在探索高精度、高效率的遙感圖像分類方法。早期利用多時相光譜信息和農(nóng)作物物候信息提取農(nóng)作物時,大多數(shù)學者采用決策樹方法[7],但傳統(tǒng)的決策樹法需人工設定閾值。隨著機器學習技術(shù)的發(fā)展,有學者引入支持向量機[8-9]和人工神經(jīng)網(wǎng)絡[10-11]等方法來提取農(nóng)作物。由于隨機森林方法不容易出現(xiàn)過擬合,對噪聲有一定的容忍度,且分類精度高,近年來在農(nóng)作物提取上得到廣泛的應用[12-13]。

        利用以上方法提取秋季作物時,綜合多時相遙感的多特征信息提取與優(yōu)化是目前研究的熱點之一。結(jié)合光譜特征、光譜衍生的指數(shù)特征、時相特征、紋理特征和DEM等多特征變量,使其優(yōu)勢互補,可以有效提高分類精度[14]。文獻[15]通過RapidEye衛(wèi)星影像,比較了紅邊光譜特征和紋理特征在提取韓國早熟型、中熟型和中晚熟型3種水稻種植面積中的重要性,發(fā)現(xiàn)在單時相中紅邊特征能較好提高不同品種水稻的分類精度,紋理特征只帶來微小的精度提高。文獻[7]將DEM數(shù)據(jù)作為特征參與決策樹分類,有效提高了山區(qū)農(nóng)作物分布的位置精度和面積精度,解決了山區(qū)分類精度比平原差的問題。文獻[16]為提取黑龍江省北安市大豆、水稻、春小麥和玉米的空間分布信息,在Sentinel-2A多時相光譜的基礎上,引入不同農(nóng)作物、不同物候期的NDVI時序變化特征,對比發(fā)現(xiàn),總體精度和Kappa系數(shù)分別提高7.7%和0.055。

        特征過多容易降低分類器性能,造成精度和效率降低[17]。多特征優(yōu)選可最大程度降低特征維數(shù),使分類器具有較好的泛化能力。優(yōu)選的特征集應具有特征和目標相關(guān)性強、特征之間冗余小和類間可分性強的特點[18]。目前和隨機森林分類器結(jié)合最多的是Relief F算法和基于隨機森林的平均不純度減少算法。文獻[19]利用Landsat-8 OLI數(shù)據(jù)提取黃河口濱海濕地信息,發(fā)現(xiàn)利用Relief F特征優(yōu)選的隨機森林法提取濕地信息具有高精度、高效率的優(yōu)勢。文獻[20]提出一種多目標遺傳隨機森林組合式特征選擇算法(MOGARF),結(jié)合隨機森林分類法提取濕地信息,并分別與Relief F算法、Boruta算法和完整特征集進行對比,結(jié)果表明,總精度提高了0.35%~1.94%,代外誤差降低0.91%~1.48%,特征維度降低至10%。文獻[21]綜合多特征采用平均不純度減少算法優(yōu)化特征子集,特征重要性排序前9個特征參與隨機森林分類時精度最高,為熱帶、亞熱帶復雜土地覆蓋分類提供了借鑒經(jīng)驗。以上2種特征優(yōu)選算法在一定程度上提高了分類精度,但算法上仍有不足,平均不純度減少算法特征關(guān)聯(lián)導致分類貢獻高特征可能重要性得分低,Relief F算法沒有考慮特征之間的相關(guān)性。

        多特征組合和特征優(yōu)選是遙感圖像分類研究的熱點之一。目前,基于特征優(yōu)選的隨機森林分類方法應用于秋季作物的分類研究較少。Relief F算法是經(jīng)典的Filter式特征選擇算法,但其隨機性對數(shù)量不均衡的高維小樣本具有一定的局限性。EMISE算法充分考慮類內(nèi)和類別之間的分離度,針對每種地物提取分離度高的特征。本文針對單一降維算法特征評價不全面的問題,通過取長補短將Relief F算法和EMISE算法融合,以增加類間距離、減小類內(nèi)距離為基本評價準則,提出一種結(jié)合Relief F算法的改進分離閾值組合式特征優(yōu)選算法(ReEMISE),并結(jié)合隨機森林法實現(xiàn)對石家莊市藁城區(qū)秋季作物種植面積的提取。同時分析不同特征組合對秋季作物分類精度的影響和不同特征對秋季作物分類的重要性,通過ReEMISE降維算法與Relief F算法和EMISE算法的對比,以驗證ReEMISE特征優(yōu)選的隨機森林分類方法(RF_ReEMISE)在秋季作物分類中的優(yōu)勢。

        1 研究區(qū)與數(shù)據(jù)獲取

        1.1 研究區(qū)概況

        藁城區(qū)位于河北省西南部(37.51°~38.18°N,114.39°~114.59°E,見圖1),石家莊市東側(cè),總面積836 km2,耕地約540 km2。由于土壤多由洪積沖積物、河流沖積物組成,肥沃可耕、灌溉便利,是華北平原的主要產(chǎn)糧區(qū),素有“河北糧倉”、“燕趙天府”之稱。該區(qū)秋季作物主要以小麥、玉米一年兩熟的輪作模式為主,其中東南部與趙縣接壤,以賈市莊鎮(zhèn)為主,主要種植梨樹;與晉州區(qū)接壤的常安鎮(zhèn)是大棚蔬菜的主要種植基地;滹沱河北部以南董鎮(zhèn)的北洼和北高莊村為中心,是花卉苗木種植基地。近年來,藁城區(qū)為適應市場需求積極引導農(nóng)民調(diào)整種植結(jié)構(gòu),大力幫扶農(nóng)民種植大豆和富硒谷子。該區(qū)秋季作物以玉米和大豆為主,小宗農(nóng)作物包括谷子、花生和高粱。秋季作物在6月中上旬播種,8月進入旺盛期,9月下旬至10月上旬為收獲期。

        1.2 數(shù)據(jù)獲取與預處理

        Sentinel-2數(shù)據(jù)下載自歐洲航天局(European Space Agency,ESA)的數(shù)據(jù)共享網(wǎng)站(https:∥scihub.copernicus.eu/)。Sentinel-2分別由歐洲航天局于2015年6月和2017年3月發(fā)射的雙星組成,其雙星重訪周期5 d,最高空間分辨率10 m。其波段從可見光到短波紅外包括13個光譜波段,是唯一包含3個紅邊波段(中心波長分別為560、665、705 nm)的光學遙感衛(wèi)星。根據(jù)研究區(qū)作物物候特征,選取無云質(zhì)量高的Sentinel-2上層大氣反射的L1C級影像3景,成像時間分別為2019年7月2日、2019年8月16日和2019年8月31日。采用精度最高[22]的SNAP軟件中的大氣校正模型Sen2cor對下載數(shù)據(jù)進行大氣校正,對影像的10個波段(不包括b1、b9和b10)雙線性重采樣為空間分辨率10 m的ENVI格式的影像數(shù)據(jù)。2019年9月底開展詳細的藁城實地農(nóng)業(yè)種植調(diào)查,采用高精度的手持GPS獲取經(jīng)緯度信息并拍照記錄。根據(jù)實地調(diào)查情況,影像地物分為5大類,包括玉米、大豆、經(jīng)濟林(果林、景觀林)、小宗作物(谷子、花生、高粱)和非植被,主要秋季作物玉米、大豆的分布見圖1。其中玉米、大豆、經(jīng)濟林、小宗作物和非植被樣本數(shù)分別為204、198、121、114、189個,按照2∶1隨機分為訓練樣本和驗證樣本。

        2 研究方法

        2.1 特征說明

        目前,綜合多時相遙感影像的多特征變量提取與優(yōu)化是農(nóng)作物遙感識別的研究熱點之一。Sentinel-2影像豐富的光譜信息具有植被紅邊波段的獨特優(yōu)勢,研究發(fā)現(xiàn)通過引入紅邊波段數(shù)據(jù)及其相關(guān)指數(shù),能整體提高農(nóng)作物面積識別精度[23-25],紋理特征豐富的地物信息,也可以提高中高分辨率遙感影像的分類精度[1-2]。王娜等[26]研究發(fā)現(xiàn)不同時相遙感影像的波段差值在優(yōu)選特征子集中占大約35%。因此,本文選擇原始光譜、傳統(tǒng)光譜指數(shù)、紅邊指數(shù)、不同時相波段差值、不同時相波段比值和紋理6類特征,共183個特征。

        原始光譜包括3景影像的10個波段(b2、b3、b4、b5、b6、b7、b8、b8A、b11、b12)的光譜反射率,共30個特征。

        不同時相波段差值和不同時相波段比值是任意組合兩組不同時相遙感影像對應波段之間的差值或比值[26],共3組影像,30個不同時相波段差值特征和30個不同時相波段比值特征。在Python 3.7中利用GDAL(Geospatial data abstraction library)批處理得到。

        傳統(tǒng)植被指數(shù)[4]與紅邊植被指數(shù)[27-28]區(qū)別在于是否有紅邊波段參與計算。3景影像共27個傳統(tǒng)植被指數(shù)和42個紅邊植被指數(shù)。

        根據(jù)前人研究,通過對原始影像主成分分析的第1主成分,在ENVI 5.3中利用灰度共生矩陣提取紋理特征[4],主要包括對比度(contrast)、熵(entropy)、自相關(guān)(correlation)、均勻性(mean)、同質(zhì)性(homogeneity)、方差(variance)、角二階矩(Second moment)、非相似性(dissimilarity)。3景影像共24個紋理特征。

        2.2 特征優(yōu)選方法

        2.2.1Relief F算法原理

        KIRA等[29]1992年提出了計算特征權(quán)重的Relief算法。其基本思想通過最近鄰學習,隨機選取一個樣本,較好的特征應該是同類樣本之間的距離較小,而不同類樣本之間的距離較大。通過賦予每個特征的權(quán)重判斷特征的重要性。但Relief僅適用2個類別的樣本。KONONENKO[30]提出了多類特征選擇的Relief F算法。具體實現(xiàn)為:在樣本中隨機抽取一個實例樣本R,在實例樣本R的同類樣本中搜索K個最近鄰樣本,分別在實例樣本R所有的不同類樣本中搜索K個最近鄰樣本,組成同類近鄰樣本集合H和不同類近鄰樣本集合T。再通過R與H和T中樣本的距離計算特征權(quán)重W。假如m個特征,隨機抽樣n次的特征權(quán)重Wm的計算式為

        (1)

        式中c——異類樣本的類別

        R[m]——特征m中的隨機樣本R的值

        H[m]——特征m中R的同類樣本最近鄰值

        T(c)[m]——特征m中R的c類樣本最近鄰值

        max(m)——特征m中最大值

        min(m)——特征m中最小值

        class(R)——樣本R的類別

        P(c)表示第c類目標的概率,其可由該類樣本數(shù)與樣本總數(shù)之比確定。

        2.2.2基于圖像熵的分離閾值算法(EMISE)

        NUSSBAUM等[31]2006年提出了分離閾值(Separability and thresholds, SEaTH)算法。該算法通過J-M(Jeffries-Matusita)距離判斷類別在特征上的分離度,對于2個類別其距離J為

        J=2(1-e-B)

        (2)

        (3)

        式中ai、σi——某特征上類別的均值和標準差,i=1,2

        B——巴氏距離

        余曉敏等[32]考慮到特征之間的冗余,提出了去相關(guān)性和加權(quán)類內(nèi)距離的改進的分離閾值算法(Improved SEaTH, ISEaTH)。通過Pearson相關(guān)系數(shù),設置閾值去掉相關(guān)性強的特征,其加權(quán)類內(nèi)距離D計算公式為

        D=(k1d1+k2d2)/(k1+k2)

        (4)

        (5)

        式中d1、d2——某特征上某類別內(nèi)所有樣本的距離累加和

        k1、k2——某類樣本數(shù)量

        ISEaTH根據(jù)類間距離、類內(nèi)距離和Pearson相關(guān)系數(shù)提取影像最優(yōu)特征子集,但沒有考慮圖像信息量。楊惠雯等[33]引入圖像信息熵,提出了一種結(jié)合圖像信息熵的閾值選擇方法。信息熵公式為

        (6)

        式中p(x)——相應的概率分布函數(shù)

        根據(jù)類間距離大和類內(nèi)距離小原則,結(jié)合圖像信息熵構(gòu)建類間可分性的評價指標計算式為

        (7)

        可知S越大,類別的可分性越好。

        2.2.3ReEMISE算法

        Relief F算法具有效率高,不受數(shù)據(jù)類型限制的優(yōu)勢[34]。但只考慮特征與類別之間的相關(guān)性,忽略了特征之間的冗余性,特征評價不全面。EMISE算法不僅考慮圖像的信息量,還通過Pearson相關(guān)系數(shù)去除特征之間的冗余。為發(fā)揮每種特征選擇方法的優(yōu)勢,使其優(yōu)勢互補能全面評價特征。本文將Relief F評價準則和EMISE評價準則融合,提出了結(jié)合Relief F和EMISE算法的改進分離閾值組合式特征優(yōu)選算法(ReEMISE)。首先,采用Relief F算法初選特征子集;然后對初選特征子集通過ISEaTH算法求出各特征類間距離與類內(nèi)距離的比值,并乘于各特征的信息熵;再次,將ISEaTH算法計算的特征值賦予Relief F算法計算的特征權(quán)重值,即EMISE特征值與Relief F特征權(quán)重相乘;最后,計算各特征之間的Pearson相關(guān)性,通過設置閾值去除特征冗余,得到最優(yōu)特征子集見圖2。ReEMISE算法在Python 3.7環(huán)境下實現(xiàn)。

        2.3 分類方法

        隨機森林是BREIMAN[35]于2001年提出的一種非參數(shù)分類與回歸方法。該算法集成了Bagging集成學習理論和隨機子空間方法,是一種高效的機器學習算法。由于其能容忍一定的噪聲,不需要遵循特定的統(tǒng)計分布,分類精度高,對過度擬合不敏感,能處理高維數(shù)據(jù),逐漸成為遙感影像分類應用最廣泛的分類器。隨機森林算法的基本思想:首選采用bootstrap抽樣方法,從原始數(shù)據(jù)中有放回的重復隨機抽取N個樣本子集,大概每個子集的數(shù)據(jù)占總樣本的2/3,1/3未被抽到的樣本稱為袋外數(shù)據(jù)。然后對N個樣本子集構(gòu)建N棵決策樹,隨機抽取m(m

        2.4 實驗方案

        為提高秋季作物分類精度,本文設計2種實驗方案,見表1。方案1設計4組實驗對比分析不同特征降維算法的隨機森林分類精度以及與支持向量機分類器的對比研究。方案2設計7組實驗對比分析不同特征組合。其研究目的為:① 研究不同特征選擇算法對分類精度的影響,分析不同特征的重要性程度。② 通過不同實驗對比,研究不同特征組合對分類精度的影響。

        表1 實驗方案Tab.1 Experimental programs

        3 結(jié)果與分析

        3.1 RF_ReEMISE分類精度分析

        3.1.1分類結(jié)果及精度分析

        ReEMISE特征優(yōu)選隨機森林分類法中,Relief F特征初選閾值為100,即選取特征權(quán)重排序較大的前100個特征組成特征初選子集。本文根據(jù)前人研究成果[32-33,36]以及實驗對相關(guān)性系數(shù)閾值選取0.96。最終得到重要性較高的68個特征見圖3,圖中,7、8、9分別表示2019年7月2日、2019年8月16日、2019年8月31日影像,r89b11表示2019年8月31日影像b11波段和2019年8月16日影像b11波段的比值,依此類推。在特征數(shù)為9個時分類精度最高,總體精度和Kappa系數(shù)分別為95.391 8%和0.939 7,見表2。前9個特征重要性得分高,分類精度急劇上升。9個之后特征重要性較低,對分類雖有一定程度的貢獻,但特征之間冗余性增強,隨機森林分類器性能受影響,分類精度處于波動狀態(tài)。RF_ReEMIS分類精度混淆矩陣見表2,玉米的生產(chǎn)者精度大于用戶精度,造成用戶精度低主要是玉米與小宗作物和經(jīng)濟林發(fā)生錯分,因為小宗作物地塊交叉在大片玉米田中,預處理時的重采樣使類別邊界模糊以及混合像元造成玉米和小宗作物錯分,玉米和經(jīng)濟林的光譜相似也造成兩者錯分。經(jīng)濟林生產(chǎn)者精度較低,主要因為農(nóng)民在小果樹下種植蔬菜以及在道路兩旁的景觀林下種植大豆造成漏分。小宗作物生產(chǎn)者精度和用戶精度都是最低的。主要原因為:① 小宗作物樣本少,特征選擇和隨機森林分類算法的偏向造成。② 常安鎮(zhèn)里莊村蔬菜種植地塊狹小,種類繁多以及收獲時期不同,容易和裸地發(fā)生混淆。③ 南董鎮(zhèn)的花卉基地地塊破碎,實地調(diào)研發(fā)現(xiàn)花農(nóng)會在裸地種植小塊作物和蔬菜,容易和經(jīng)濟林發(fā)生混淆,見圖4a。

        表2 ReEMISE特征選擇的隨機森林分類精度Tab.2 Classification accuracy of RF_ReEMISE

        3.1.2選取特征重要性分析

        從圖3中看出,特征重要性差異較大,最高的重要性得分達2 622.217 611,最低重要性得分只有0.019 185,對分類幾乎不產(chǎn)生影響。重要性得分排序前9個特征是7contrast、8b2、8b4、7variance、8b3、r89b11、7PSSRa、9b3、8MNDWI。紋理特征7contrast和7variance分別位居第1和第4位,重要性得分遠高于其他。在前60個特征中出現(xiàn)的紋理特征只包括3個不同時相的對比度(contrast)、方差(variance)和非相似性(dissimilarity),其都體現(xiàn)了圖像的差異性,說明在秋季作物分類中應選擇與差異性有關(guān)的紋理特征。2019年7月2日影像紋理特征重要,主要因為此物候期植被地表覆蓋度不同(覆蓋度由大到小依次為:經(jīng)濟林、玉米、大豆、非植被)。雖然玉米和大豆都處于苗期,但玉米地表覆蓋度大影像亮度較暗,大豆土壤裸露多影像較亮。原始光譜在重要性中占有重要地位,前9個特征中8b2、8b4、8b3、9b3得分769.823 441、417.334 399、246.646 688、88.710 256??芍?,在Sentinel-2的3個時相30個光譜中可見光波段最重要,其次是短波紅外,這與王利民等[37]的研究結(jié)果一致,短波紅外的加入可以一定程度上提高玉米和大豆的分類精度。紅邊波段是植被在紅光波段和近紅外波段之間的一個“爬坡現(xiàn)象”,是Sentinel-2衛(wèi)星除10 m分辨率外的又一優(yōu)勢。很多學者對紅邊波段在植被分類中的重要性進行了研究[38-39]。從特征重要性得分排序看出,紅邊波段對農(nóng)作物面積提取有一定幫助,主要體現(xiàn)在紅邊的b5波段,與MARKUS等[25]研究結(jié)果一致。紅邊波段排在其次的是b6波段,b7波段被全部剔除。r78b5和r78b6分別排在40位和43位,不同時相的紅邊波段比值的重要性反映了紅邊波段對植被變化比較敏感。近紅外波段對農(nóng)作物提取貢獻最小,主要體現(xiàn)在不同時相的短波紅外光譜比值,其r89b11特征排在第6位。水體指數(shù)重要性較高主要因為研究區(qū)內(nèi)包括了滹沱河和人工湖,改進的歸一化差異水體指數(shù)(MNDWI)比歸一化水體指數(shù)(NDWI)重要性高,說明利用短波紅外代替近紅外的MNDWI提取水體更有效[40]。從特征重要性得分和排序上看,紅邊植被指數(shù)比傳統(tǒng)指數(shù)中的傳統(tǒng)植被指數(shù)重要性高,傳統(tǒng)植被指數(shù)主要體現(xiàn)在能有效降低土壤背景噪聲影響的修正土壤調(diào)節(jié)植被指數(shù)(MSAVI)和增強植被指數(shù)(EVI)。紅邊植被指數(shù)重要性最高的是冠層葉綠素指數(shù)(PSSRa),其次是葉綠素吸收指數(shù)(MCARI2)、地面葉綠素指數(shù)(MTCI)、紅邊葉綠素指數(shù)(CIre)。紅邊植被指數(shù)的重要性體現(xiàn)在和葉綠素的相關(guān)性較大的指數(shù)上,說明不同植被葉綠素含量不同,光譜具有差異。利用與葉綠素相關(guān)性高的指數(shù)可以提高秋季作物分類精度,為農(nóng)作物種植面積提取提供新思路。分類效果最佳時,9個特征中不同特征所占的比重見圖5,多時相光譜特征最顯著,達到44.4%,其次是紋理特征,占比22.2%。

        從表3中可以看出,8月中旬是提取農(nóng)作物的最佳時相,此時主要秋季作物玉米、大豆、谷子和花生等處于茂盛期,光譜信息豐富,同類地物光譜差異小,不易造成“同物異譜”現(xiàn)象。同時,藁城區(qū)主要種植的漏天蔬菜菜花處于剛定植時期,生長稀疏,易于光譜識別。其次是7月上旬,此時秋季主要作物處于苗期,而果林和景觀林長勢茂盛,易于光譜識別。8月末和9月上旬,此時同種作物播種時間差異光譜反映明顯,“同物異譜”現(xiàn)象嚴重。

        表3 優(yōu)選特征子集不同時相分布Tab.3 Feature subsets preferably distributed in different phases

        3.2 方案1不同特征選擇算法及不同分類器精度比較

        為比較ReEMISE算法特征選擇效果,分別與Relief F算法和EMISE算法的隨機森林分類精度比較。同時與支持向量機分類法比較,驗證隨機森林處理高維小樣本數(shù)據(jù)的性能。4種不同實驗的分類結(jié)果見圖4,通過目視解譯法與原始圖像比較,RF_Relief F和SVM_ReEMISE椒鹽現(xiàn)象嚴重,右下角的梨園存在嚴重的錯分情況,見圖6。為定量評價不同實驗的分類精度,實驗評價指標包括總體分類精度、錯分誤差、漏分誤差和Kappa系數(shù)。由表4可知,在特征變量9個時,ReEMISE算法達到最高分類精度,其總體精度和Kappa系數(shù)分別為95.391 8%和0.939 7,相比EMISE算法和Relief F算法總體分類精度分別提高1.654 9%和24.036 8%,Kappa系數(shù)提高0.021 6和0.309 6。Relief F算法在特征變量18個時達到最高精度,其總體精度和Kappa系數(shù)分別為95.340 3%和0.939。Relief F算法在特征變量45個時達到最高精度,其總體精度和Kappa系數(shù)分別為95.315%和0.938 7。由于前9個特征重要性得分高,3種算法分類精度指標都快速上升。ReEMISE算法在9個特征達到最高精度,然后隨著特征增加,特征之間出現(xiàn)冗余并且重要性降低,造成精度下降。Relief F算法特征變量在9~18之間精度指標逐漸上升達到最高,然后處于波動狀態(tài)。EMISE算法特征變量9個之后精度指標逐漸緩慢上升,45個時達到最高精度,然后略有下降。從圖7可以直觀看出,利用ReEMISE特征優(yōu)選算法提取農(nóng)作物,每種類別的錯分誤差和漏分誤差都小于其他算法。ReEMISE算法錯分誤差和漏分誤差最大的是小宗作物分別為30.24%和11.60%,與EMISE算法相比錯分誤差降低6個百分點,漏分誤差降低8.43個百分點。與Relief F算法相比錯分誤差降低19.02個百分點,漏分誤差降低15.18個百分點。由以上得出,ReEMISE算法選擇子集最優(yōu),主要包括2個方面:① 最高精度時特征變量數(shù)量最少。

        表4 不同特征選擇算法隨機森林分類精度比較Tab.4 Comparison of classification accuracy of random forest with different feature selections

        ② 3種算法不同特征變量數(shù)量達到最高精度時ReEMISE算法分類精度指標最高。在ReEMISE特征選擇下,比較隨機森林分類器和支持向量機分類器性能。隨機森林9個特征變量時達到最高精度,比支持向量機總體精度提高16.96%,Kappa系數(shù)提高0.219 1。支持向量機分類法在特征變量33個時達到最高精度,總體精度和Kappa系數(shù)分別為95.135 9%和0.936 5。由表4看出,隨機森林分類器總體上優(yōu)于支持向量機分類器。采用i7-9750H CPU,16 GB內(nèi)存的測試環(huán)境,隨機森林分類時,183個特征全部參與分類用時610 s,9個特征分類用時123 s。支持向量機法在最高精度33個特征時分類用時542 s。ReEMISE降維算法能在保證精度下提高分類速度。

        3.3 方案2不同特征組合精度分析

        為了定量準確評價不同特征組合對農(nóng)作物提取精度的影響,本文通過在光譜特征基礎上分別加入不同特征共設計7組實驗進行驗證,其評價指標主要包括總體精度、Kappa系數(shù)、生產(chǎn)者精度和用戶精度,見圖8。多時相光譜特征實驗總體精度為93.043 4%,Kappa系數(shù)為0.908 8。在多時相光譜特征的基礎上加入傳統(tǒng)指數(shù)和紅邊指數(shù)后分類精度都有所提升,總體精度分別提高1.502 1、1.571 7個百分點,Kappa系數(shù)分別提高0.019 8和0.020 7。其中紅邊指數(shù)特征精度最高,說明植被的紅邊可以顯著提高秋季作物分類精度。但加入紋理特征、波段比值特征和波段差值特征后精度都略有下降,其中加入紋理特征后只對非植被精度略有改善,而導致植被類包括玉米、大豆、小宗作物和經(jīng)濟林的生產(chǎn)者和用戶精度降低。說明中分辨率10 m的遙感影像紋理特征不一定能提高秋季作物分類精度,甚至可能降低精度。加入波段差值和波段比值特征精度下降,說明多時相光譜特征與波段差比特征相關(guān)性強,對分類貢獻小。這與圖3特征的重要性排序結(jié)果一致,從183個特征中選擇重要性較高的68個特征,不同時相的波段差值特征全部被剔除。加入傳統(tǒng)指數(shù),除了非植被類別用戶精度略微降低外,其他類別用戶精度和生產(chǎn)者精度都有提升,尤其對經(jīng)濟林、小宗作物和大豆的生產(chǎn)者精度分別提高2.89、2.26、2.61個百分點。說明傳統(tǒng)指數(shù)的加入有助于提高經(jīng)濟林、小宗作物和大豆的精度。加入紅邊指數(shù),經(jīng)濟林的生產(chǎn)者精度提高最顯著,由83.72%提高到90.94%。加入紅邊指數(shù)對提高大豆和玉米的精度也有幫助,但小宗作物的生產(chǎn)者精度下降1.4個百分點。波段差值導致各類別用戶精度和生產(chǎn)者精度不增反降。波段比值除大豆生產(chǎn)者精度和小宗作物用戶精度下降外,其他都有不同程度提高。說明不同時相波段比值特征比波段差值特征對提高秋季作物分類精度更有幫助。ReEMISE算法特征優(yōu)選結(jié)果與多時相光譜相比總體精度提高2.348 4個百分點,Kappa系數(shù)提高0.030 9。特征優(yōu)選中各類別的生產(chǎn)者精度和用戶精度都比其他特征組合的精度高,說明多種特征組合可以有效提高秋季作物分類精度。

        4 結(jié)論

        (1)在隨機森林分類前,利用ReEMISE降低特征維度可以有效提高運算速度和分類精度。相比Relief F和EMISE降維算法,ReEMISE在保證分類精度的前提下,可大幅降低特征維度,說明ReEMISE優(yōu)選的特征子集數(shù)據(jù)冗余小、特征重要性高,能很好地平衡特征維度和分類精度,與支持向量機分類器相比,隨機森林分類精度更高。

        (2)在多時相光譜特征基礎上,通過單獨引入不同特征研究了不同特征對秋季作物分類精度的影響。傳統(tǒng)指數(shù)特征和紅邊指數(shù)特征對分類精度產(chǎn)生積極影響,分別加入紋理特征、不同時相波段比值特征和不同時相波段差值特征后分類精度有所下降。全部特征參與的特征優(yōu)選組合生產(chǎn)者精度和用戶精度都比其他組合高,綜合多特征是提高秋季作物分類精度的關(guān)鍵。

        (3)特征重要性分析表明,原始光譜信息的8b2(2019年8月16日影像藍光)、8b4(2019年8月16日影像紅光)、8b3(2019年8月16日影像綠光)、9b3(2019年8月31日影像綠光)最重要,其次是紋理信息的7contrast(2019年7月2日影像對比度)、7variance(2019年7月2日影像方差),證明了能表現(xiàn)差異性的紋理特征在農(nóng)作物分類中的重要性。不同時相波段的差值特征全部被舍棄。

        猜你喜歡
        重要性分類特征
        “0”的重要性
        分類算一算
        論七分飽之重要性
        幼兒教育中閱讀的重要性
        甘肅教育(2020年21期)2020-04-13 08:09:24
        如何表達“特征”
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        分類討論求坐標
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        抓住特征巧觀察
        国产色av一区二区三区| 提供最新的在線欧美综合一区| 亚洲欧洲日产国码久在线观看| 亚洲成人黄色av在线观看| 极品粉嫩小仙女高潮喷水操av| 女人脱了内裤趴开腿让男躁| 免费黄色电影在线观看| 国产一区二区a毛片色欲| 少妇精品揄拍高潮少妇桃花岛| 五月综合激情婷婷六月| 吃奶摸下的激烈视频| 国产精品亚洲综合色区韩国| 97人妻中文字幕总站| 帅小伙自慰videogay男男| 国产精品久久久久电影网| 亚洲AV永久无码精品一区二国| 日本一区二区三区丰满熟女| 女人高潮内射99精品| 香蕉视频www.5.在线观看| 久久AⅤ天堂Av无码AV| 亚洲 欧美 激情 小说 另类| 无码高清视频在线播放十区| 今井夏帆在线中文字幕| 国产无夜激无码av毛片| 1000部拍拍拍18勿入免费视频下载| 国产精品无套粉嫩白浆在线| 中文字幕第一页人妻丝袜| 国产一区二区三区四区五区加勒比| 亚洲中文字幕无线无码毛片 | 在线看亚洲十八禁网站| 精品一区二区三区中文字幕在线| 国产毛片av一区二区| 亚洲男人av天堂午夜在| 日本一区二区啪啪视频| 亚洲免费精品一区二区| 国产后入清纯学生妹| 国内精品久久久久久久久齐齐| 亚洲精品精品日本日本 | 巨人精品福利官方导航| 日韩中文网| 久久久国产精品三级av|