亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多源數(shù)據(jù)的南方丘陵山地土地利用隨機森林分類

        2021-06-30 01:05:28李恒凱王利娟肖松松
        農(nóng)業(yè)工程學(xué)報 2021年7期
        關(guān)鍵詞:分類特征

        李恒凱,王利娟,肖松松

        基于多源數(shù)據(jù)的南方丘陵山地土地利用隨機森林分類

        李恒凱,王利娟,肖松松

        (江西理工大學(xué)土木與測繪工程學(xué)院,贛州 341000)

        針對南方丘陵山地因地形破碎和山體陰影而導(dǎo)致的分類精度低問題,該研究以東江源地區(qū)為例,通過結(jié)合多源數(shù)據(jù),以Sentinel-1、Sentinel-2A衛(wèi)星影像和DEM作為數(shù)據(jù)源提取27個指標(biāo),構(gòu)建了6種特征變量集,并設(shè)計了9種方案,探討加入紅邊特征、雷達(dá)特征和地形特征對南方丘陵山地土地利用分類信息提取的作用。同時結(jié)合隨機森林算法和遞歸特征消除法進(jìn)行特征變量優(yōu)選和特征重要性排序,將隨機森林特征優(yōu)選后的分類結(jié)果與支持向量機算法(Support Vector Machine,SVM)和K近鄰算法(K-Nearest Neighbor,KNN)作對比。結(jié)果表明:在未進(jìn)行特征變量優(yōu)選時,僅使用Sentinel-2A的光譜特征提取的東江源地表覆蓋分類總體精度和Kappa系數(shù)最低,在以光譜特征、植被指數(shù)和水體指數(shù)作為基本方案時,加入紅邊特征、雷達(dá)特征和地形特征后均可以有效地提升各地物分類精度,其中地形特征的加入更有助于對東江源園地和耕地信息的提取。通過結(jié)合隨機森林和遞歸特征消除算法進(jìn)行特征優(yōu)選,在保持分類精度最優(yōu)的情況下將所有特征變量從21個降低到13個,并且總體精度達(dá)到0.937 2,Kappa系數(shù)達(dá)到0.923 4,分類精度優(yōu)于相同特征下的支持向量機算法(SVM)和K近鄰算法(KNN),對東江源土地利用信息提取效果最佳。該研究提出基于多源數(shù)據(jù)的隨機森林方法可為地形復(fù)雜的南方丘陵山地土地利用信息提取提供技術(shù)支持和理論參考。

        土地利用;分類;丘陵山地;隨機森林;多源遙感數(shù)據(jù);Sentinel-2A;Sentinel-1

        0 引 言

        土地利用/覆蓋變化(Land-Use and Land-Cover Change,LULC)是全球環(huán)境變化的重要組成部分,在自然災(zāi)害和危害監(jiān)測、城市和區(qū)域規(guī)劃、土壤侵蝕和鹽分估算、生態(tài)環(huán)境脆弱性和生態(tài)系統(tǒng)服務(wù)等領(lǐng)域發(fā)揮著重要的作用[1-3]。當(dāng)前在大尺度的土地資源遙感研究應(yīng)用中,主要使用的是Landsat TM/ETM+、SPOT和MODIS等中等空間分辨率遙感數(shù)據(jù),然而受其傳感器空間分辨率影響,在地形復(fù)雜區(qū)域的應(yīng)用中僅依賴有限的光譜特征難以保證分類精度[4]。歐空局于2015年發(fā)射的Sentinel-2A衛(wèi)星遙感數(shù)據(jù)因其光譜波段豐富、時空分辨率較高,為土地利用遙感分類提供了多維特征空間和新的數(shù)據(jù)源[5-6]。蔡文婷等[7]利用Sentinel-2A光譜和紋理信息對山東禹城冬小麥作物茬覆蓋度估算發(fā)現(xiàn)Sentinel-2A與Landsat OLI相比具有較大優(yōu)勢。Antoine等[8]和Markus等[9]利用Sentinel-2A數(shù)據(jù)對城市不透水面和農(nóng)作物進(jìn)行變化監(jiān)測和制圖,發(fā)現(xiàn)Sentinel-2A紅邊波段對提高分類精度有重要作用。盡管目前光學(xué)遙感技術(shù)已經(jīng)非常成熟,但是在南方多云多雨的丘陵山區(qū),由于受云霧和地形的影響較大,在一定程度上影響了光學(xué)遙感對地物識別的精度。雷達(dá)影像不僅能全天時全天候的工作,而且能獲取不同于光學(xué)影像的地物信息[10],通過結(jié)合光學(xué)和雷達(dá)數(shù)據(jù)可以增強對地物的識別能力和提高分類精度。相關(guān)學(xué)者通過結(jié)合Sentinel-2A和Sentinel-1成功應(yīng)用在農(nóng)耕區(qū)[11-12]、城市用地[13]和濕地[14]等地表信息提取并取得較好的分類效果。此外,Wang等[15]通過在地形復(fù)雜的祁連山通過引入地形因子并取得了 88.84%的分類精度,證明了地形因子對山區(qū)分類的重要性。

        近年來,機器學(xué)習(xí)算法在土地利用分類研究中得到廣泛應(yīng)用,如最大似然法、支持向量機、隨機森林等。其中隨機森林方法因其分類精度高、處理多維數(shù)據(jù)變量能力強、訓(xùn)練和預(yù)測速度快的優(yōu)點被廣泛應(yīng)用于土地利用分類研究中[16-17]。文獻(xiàn)[18-20]使用隨機森林算法對農(nóng)耕區(qū)、濕地進(jìn)行土地利用信息提取并取得較高的精度,為特定區(qū)域的土地利用信息提取提供了可行的方法。盡管現(xiàn)有全球10 m分辨率土地利用制圖,然而該產(chǎn)品主要應(yīng)用于全國尺度城市的土地利用遙感制圖研究[21],在地形破碎、土地利用分散的南方丘陵山地的具體區(qū)域的應(yīng)用分類效果上具有一定局限性,尤其是丘陵山地由于山體陰影和混合像元普遍存在,對地表信息精準(zhǔn)提取造成較大干擾[22]。

        上述研究表明,結(jié)合光譜、紅邊、雷達(dá)特征和地形特征使用隨機森林方法可提高丘陵山地的土地利用分類精度,因此本研究以東江源地區(qū)為例,結(jié)合多源遙感數(shù)據(jù)Sentinel-1、Sentinel-2A和DEM,構(gòu)建適合于南方丘陵山地土地利用分類的隨機森林模型。同時經(jīng)過特征優(yōu)選和特征重要性排序篩選出最佳分類組合,最后通過與支持向量機算法(Support Vector Machine,SVM)和K近鄰算法(K-Nearest Neighbor,KNN)分類結(jié)果進(jìn)行對比,研究特征優(yōu)選后的隨機森林算法在南方丘陵山地的土地利用分類的適用性。

        1 材料和方法

        1.1 研究區(qū)概況與數(shù)據(jù)源

        1.1.1 研究區(qū)概況

        東江源位于江西省贛州市境內(nèi)尋烏、安遠(yuǎn)和定南3個縣,其東臨福建省,南接廣東省,地理坐標(biāo)位于114°47′36″E~115°52′36″E、24°30′30″N~25°12′18″N,屬于珠江流域東江水系,其水質(zhì)及區(qū)域生態(tài)環(huán)境直接影響著粵港兩地人民群眾的飲用水安全[23]。東江源流域總面積約為3400km2,約占東江流域面積的 10%,海拔為161~1 498 m;屬于亞熱帶季風(fēng)濕潤氣候,平均年降水量在1 500~2 400 mm,西南多,東北少。東江源區(qū)地物分布復(fù)雜,地塊小且破碎,林地農(nóng)作物混雜度高,園地以臍橙、百香果種植為主,是典型的南方低山丘陵山地。研究區(qū)地理位置如圖1所示。

        1.1.2 數(shù)據(jù)來源與預(yù)處理

        東江源位于多云多雨的南方丘陵山地地帶,無云或少云量的數(shù)據(jù)一般較難獲得,通過結(jié)合光學(xué)影像和微波雷達(dá)影像各自優(yōu)點可以提高地物識別精度,因此本研究選用的是質(zhì)量較好的2019年9月19日的Sentinel-2A L1C級別的多光譜數(shù)據(jù)和2019年9月17日的Sentinel-1的寬幅模式(IW)的地距(GRDH)產(chǎn)品數(shù)據(jù)(來自于歐空局網(wǎng)站(https://scihub.copernicus.eu/))。Sentinel-2A搭載的多光譜傳感器可覆蓋從可見光到短波紅外的13個波段,其中包含10、20和60 m 3種空間分辨率。本研究采用的是空間分辨率為10和20 m的10個波段,相關(guān)波段參數(shù)如表1所示。由于Sentinel-2A L1C級數(shù)據(jù)已經(jīng)進(jìn)行幾何校正和輻射校正,因此只需利用ESA提供的Sen2Cor插件和SNAP軟件對L1C級數(shù)據(jù)進(jìn)行大氣校正和重采樣,通過Sen2Cor插件將大氣表觀反射率(TOA)轉(zhuǎn)化為L2A級別大氣底層反射率數(shù)據(jù)(BOA),然后在SNAP中剔除60 m的分辨率波段數(shù)據(jù)并使用最近鄰法將20 m波段數(shù)據(jù)重采樣至10 m。

        表1 Sentinel-2A 波段參數(shù)

        針對Sentinel-1的寬幅模式(IW)的地距(GRDH)產(chǎn)品數(shù)據(jù),空間分辨率為10 m,采用VV和VH雙極化方式。本研究利用SNAP軟件對該數(shù)據(jù)進(jìn)行軌道校正、熱噪聲去除、輻射定標(biāo)、濾波和地形校正,最后通過分貝化處理將雷達(dá)強度圖像轉(zhuǎn)化為VV和VH方向后向散射系數(shù)圖。其他輔助數(shù)據(jù)為空間分辨率為30 m的SRTM DEM,使用最近鄰法將其重采樣至10 m用于地形因子的提取。

        1.1.3 地表覆蓋分類體系及樣本點選取

        參照國家土地利用分類標(biāo)準(zhǔn)《GB/T21010-2017》并結(jié)合研究區(qū)Sentinel 2A影像的光譜和紋理特征,將東江源土地利用類型分為:林地、園地、建設(shè)用地、水體、耕地和裸地。本研究通過東江源實地考察利用手持GPS獲取部分土地利用類型的樣本點,同時在ArcGIS使用采用分層隨機采樣方法對樣本進(jìn)行補充。為進(jìn)一步保證樣本點的精確性,結(jié)合Google Earth高分辨率影像剔除所選樣本中異常點最終獲得樣本點391 9個,其中林地1039個、園地530個、建設(shè)用地546個、水體645個、耕地777個和裸地382個。

        1.2 研究方法

        1.2.1 技術(shù)路線

        本研究通過對多源遙感數(shù)據(jù)Sentinel-1、Sentinel-2A和DEM進(jìn)行預(yù)處理,然后構(gòu)建東江源土地利用分類特征變量集和特征變量組合方案,最后分別進(jìn)行隨機森林分類。結(jié)合遞歸特征消除法和隨機森林法進(jìn)行特征優(yōu)選和特征重要性排序從而篩選出最佳分類組合,同時與支持向量機算法(SVM)和K近鄰算法(KNN)分類結(jié)果進(jìn)行對比,評價特征優(yōu)選后的隨機森林算法在南方丘陵山地的土地利用分類的適用性,技術(shù)路線圖如圖2所示。

        1.2.2 特征變量集的構(gòu)建與實驗方案的設(shè)計

        Forkuor等[24-25]發(fā)現(xiàn)通過加入紅邊波段和雷達(dá)指數(shù)可以有效提升土地利用分類精度,因此本研究基于多源遙感數(shù)據(jù):Sentinel-2A遙感影像數(shù)據(jù)、Sentinel-1雷達(dá)影像數(shù)據(jù)和DEM,通過提取的27個指標(biāo)構(gòu)建了6組東江源地表分類特征變量集,如表2所示。

        本研究設(shè)計了9種方案(如表3所示),方案1僅使用Sentinel-2A原始影像光譜特征(紅邊波段B5、B6、B7除外),方案2使用傳統(tǒng)遙感影像特征:光譜特征、無紅邊植被指數(shù)和水體指數(shù)。在方案2的基礎(chǔ)上,方案3增加了紅邊特征變量,方案4增加了雷達(dá)特征變量,方案5增加了地形特征變量。方案6為所有特征變量。通過隨機森林分類,探索使用隨機森林算法在加入紅邊特征、雷達(dá)特征和地形特征后對東江源土地利用分類的影響。方案7-9使用RF、SVM、KNN 3種機器學(xué)習(xí)分類算法對特征優(yōu)選組合進(jìn)行分類對比驗證。

        表2 特征變量集

        注:特征優(yōu)選是通過遞歸特征消除法和隨機森林法相結(jié)合的方法實現(xiàn)。0(db)為后向散射系數(shù)0分貝化。

        Note: Feature optimization is realized by combining recursive feature elimination method and random forest method.0(db) represents the backscatter coefficient0in decibels.

        表3 組合方案信息

        1.2.3 特征變量優(yōu)選

        在分類過程中所有特征波段參與分類不僅會增加模型復(fù)雜度和導(dǎo)致信息冗余,還會造成“維數(shù)災(zāi)難”,從而導(dǎo)致分類性能下降,因此非常有必要對不同特征變量進(jìn)行特征選擇[26]。為了確定最佳分類個數(shù)和變量類型,本研究通過利用遞歸特征消除法和隨機森林法相結(jié)合的方法來選取適合東江源的最佳分類特征組合。

        遞歸特征消除法(Recursive Feature Elimination,RFE)是一種尋找最優(yōu)特征子集的貪心算法,其核心思想是在保持分類性能不變的同時進(jìn)行特征指數(shù)的降維,在分類時用于特征選擇以取得比較理想的結(jié)果。該方法首先通過正則化回歸剔除正則化系數(shù)為0的特征變量,在新的特征集基礎(chǔ)上通過循環(huán)移除特征變量和反復(fù)建立模型對特征準(zhǔn)確率進(jìn)行評價,剔除得分最低的特征,直至遍歷所有特征最后得出最有效的特征組合[27]。本研究通過采用scikit-learn的RFE模塊來實現(xiàn)特征消除,并使用RFECV模塊進(jìn)行交叉驗證對特征進(jìn)行排序。

        1.2.4 隨機森林分類算法

        隨機森林(Random Frost,RF)算法是由Breiman等于2001年提出的一種非線性和非參數(shù)分類器,允許來自多源的高維數(shù)據(jù)的融合,對缺失值和異常值有較高忍耐性,適用于高維復(fù)雜數(shù)據(jù)集,并且能自動判斷變量的重要性。它以決策樹為基本單元,通過集成學(xué)習(xí)的思想將若干決策樹集成在一起,利用多棵樹對樣本進(jìn)行訓(xùn)練與預(yù)測,采用投票方式?jīng)Q定樣本的分類結(jié)果[28]。

        隨機森林通過構(gòu)造不同的樣本訓(xùn)練集,擴(kuò)大決策樹各分類模型間的差異,從而提高組合分類模型的外推預(yù)測能力。在通過輪訓(xùn)練得到一個分類模型序列{1(),2()…h()},此時構(gòu)成一個多分類模型系統(tǒng),通過采用簡單多數(shù)投票決策的方式得到最終分類結(jié)果,最終的分類決策為

        式中()表示組合分類模型,h表示單個決策樹分類模型,表示輸出變量,(°)為示性函數(shù)。在構(gòu)建隨機森林分類算法的過程中需要設(shè)置決策樹的個數(shù)(n_estimators)和保證模型達(dá)到最優(yōu)時的最大特征數(shù)(max_feature)。本研究使用網(wǎng)格搜索交叉驗證方法(GridSearchCV)進(jìn)行參數(shù)尋優(yōu)。通過大量實驗發(fā)現(xiàn)當(dāng)n_estimators設(shè)置為300時誤差逐漸收斂并趨于穩(wěn)定,此時最大特征數(shù)設(shè)置為總特征數(shù)的平方根。

        1.2.5 精度評價

        考慮到東江源區(qū)位于南方丘陵山地,地形破碎和像元噪點數(shù)據(jù)對分類精度產(chǎn)生影響,本研究使用117 5個驗證樣本點數(shù)據(jù),利用混淆矩陣中的用戶精度(User’s Accuracy, UA)、生產(chǎn)者精度(Producer’s Accuracy, PA)、總體精度(Overall Accuracy, OA)和Kappa系數(shù)來對分類器的性能進(jìn)行評價。其中Kappa系數(shù)用來描述分類器的整體性能,用戶精度(UA)和生產(chǎn)者精度(PA)可以評價某一類別的優(yōu)劣。其具體公式如下所示:

        式中代表總樣本數(shù),為總類別數(shù);N為被分到正確類別的樣本數(shù);+i和N+分別是第類的真實樣本數(shù)和預(yù)測為第類的樣本數(shù)。

        2 結(jié)果與分析

        2.1 特征變量優(yōu)選

        本研究通過結(jié)合隨機森林法(RF)和遞歸特征消除法(RFE)對東江源27個特征波段進(jìn)行特征變量的優(yōu)選。首先采用Loss L1-正則化線性回歸方法剔除6個特征權(quán)值為0的特征指數(shù),得到二次“初始”的特征指數(shù);其次基于測試數(shù)據(jù)集通過遞歸特征消除法繪制了最佳特征組合個數(shù)和總體精度、Kappa系數(shù)之間的關(guān)系(圖3)。從特征篩選的過程曲線中可以發(fā)現(xiàn),當(dāng)特征變量為13時,隨機森林分類的總體精度和Kappa系數(shù)值達(dá)到最大,隨著特征數(shù)量的增加,分類精度趨于穩(wěn)定,分類效果并不會持續(xù)改善。通過特征優(yōu)選可以發(fā)現(xiàn)在保證分類精度最優(yōu)的同時可以減少無關(guān)特征變量參與分類,提高了分類效率,因此本研究確定最佳特征個數(shù)為13。

        根據(jù)隨機森林算法的OOB袋外誤差對提取的21個特征變量進(jìn)行重要性排序并進(jìn)行特征優(yōu)選,選擇前13個特征指數(shù)結(jié)果如圖4所示,特征重要性由高到低依次為B12、RNDVI、RVI、B5、B8、B11、DEM、B6、NDWI、SLOPE、GNDVI、B2和B7。綜合特征類別來看,特征變量的重要性貢獻(xiàn)率排序如下:光譜特征>紅邊特征變量>植被指數(shù)>地形特征>水體指數(shù)。其中光譜特征變量和紅邊特征變量貢獻(xiàn)率較高,分別為26.09%和23.55%;植被指數(shù)和地形特征次之,分別為11.62%和11.62%,水體指數(shù)特征貢獻(xiàn)最小為5.57%。雷達(dá)特征變量雖對分類結(jié)果提高提供了一定的貢獻(xiàn)率,但是在考慮保持分類精度和效率的同時,優(yōu)選后的特征未包含雷達(dá)特征變量。其中Sentinel-2A的短波紅外波段(B12)的重要性得分最高,達(dá)到0.090 1,對研究區(qū)土地利用分類覆蓋貢獻(xiàn)度最大,這是因為短波紅外波段對葉片含水量反映敏感,能夠很好地區(qū)分出植被[29]。而東江源林地和園地占地面積大,林地多為針葉林和闊葉林,植被覆蓋度高,因此其重要性較高,這與實際情況相符合,同時與Antoine等[8]和Markus等[9]研究結(jié)果相一致。紅邊植被指數(shù)RNDVI的重要性得分次之,值為0.067 7,正是由于受到植物體內(nèi)葉綠素吸收作用的影響,植被在紅邊波段存在陡峭的“反射肩”后,在東江源區(qū)域內(nèi)使得紅邊波段更有利于植被和其他地物類型的區(qū)分。比值植被指數(shù)RVI能較好地反映植被的健康狀況,重要性排名位于第三,重要性得分為0.065 5。

        2.2 東江源土地利用分類精度評價

        本研究采用總體精度、Kappa系數(shù)、生產(chǎn)者精度和用戶精度作為東江源區(qū)土地利用分類結(jié)果的評價指標(biāo),提出的9種實驗方案的分類結(jié)果如表4所示。在未進(jìn)行特征變量優(yōu)選時,僅使用Sentinel-2A的光譜特征提取的東江源地表覆蓋分類總體精度和Kappa系數(shù)最低;方案2使用光譜特征、植被指數(shù)(無紅邊)和水體指數(shù)的總體精度為0.884 8,Kappa系數(shù)為0.858 8,與方案2相比較方案3、4和5總體精度分別提高了0.77、1.79和4.27百分點,Kappa系數(shù)則分別提高了0.94、2.18和5.2百分點,說明在加入紅邊特征、雷達(dá)特征和地形特征后可以有效地提升東江源區(qū)地表土地利用分類精度,其中加入地形特征后精度提升最高。方案6將所有特征變量組合在一起取得了0.936 9的總體精度,Kappa系數(shù)達(dá)到0.922 5,但是特征組合變量過多容易造成信息冗余和提高模型復(fù)雜度。在經(jīng)過特征優(yōu)選后方案7不僅取得了最好的分類效果,總體精度達(dá)到0.937 2,Kappa系數(shù)為0.923 4,還有效的將所有特征變量從21個降低到13個,提高了數(shù)據(jù)處理效率。

        各個地物類型的生產(chǎn)者精度和用戶精度(圖5)可知,方案3在加入紅邊特征變量后,園地和耕地的用戶精度有所下降,其他地物分類精度有所提高。這是因為在隨機森林特征重要性排序中光譜特征對植被分類貢獻(xiàn)大,加入紅邊特征后可能由于數(shù)據(jù)冗余降低分類器性能,造成園地和耕地分類精度下降,因此紅邊特征的加入有助于建設(shè)用地、裸地和林地的提取。

        方案4加入雷達(dá)特征變量后,雖然總體分類精度提高,但是建設(shè)用地和裸地分類精度下降,這是因為雷達(dá)波段重在其具有穿透力,能夠穿透冠層獲取植物信息。對于光譜特征相似的園地和耕地,雷達(dá)后向散射系數(shù)是對光學(xué)波段反射率的有效補充,能提高類型間的差異程度;而建設(shè)用地和裸地因其光譜反射率差異相對較大,雷達(dá)后向散射系數(shù)的加入增加了信息冗余,從而降低了分類精度;雷達(dá)特征因其對水體比較敏感而提高了水體的分類精度。方案5在加入地形特征變量后,與方案2相比較耕地和園地的分類精度有了較大幅度的提升,耕地的生產(chǎn)者精度和用戶精度分別提高了10%和16%,園地生產(chǎn)者精度和用戶精度分別提高了13%和11%。這與東江源實際情況相符,由于東江源位于南方丘陵山地,園地主要以尋烏和安遠(yuǎn)縣種植的蜜桔和臍橙為主,且大多位于海拔200 m以上的山坡上。耕地和園地混合分布、相互滲透并且在影像上是相似的,在光譜上“同物異譜”和“異物同譜”的現(xiàn)象嚴(yán)重,導(dǎo)致僅使用光譜特征變量、植被指數(shù)和水體指數(shù)很難將其進(jìn)行有效的區(qū)分。因此在分類過程中存在將耕地誤分為園地的現(xiàn)象,而地形特征變量中的高程、坡度和坡向特征變量能夠有效減少園地和耕地的錯分情況。

        表4 各方案分類結(jié)果精度比較

        2.3 不同分類方法精度比較

        為評價構(gòu)建適合于南方丘陵山地土地利用分類的隨機森林模型的適用性,本研究將特征優(yōu)選后的波段組合與遙感影像分類中常用的機器學(xué)習(xí)非參數(shù)分類方法支持向量機(SVM)和K近鄰算法(KNN)的分類結(jié)果作對比分析[30]。分類精度結(jié)果如表5方案7、8和9所示,其中基于RF算法的分類精度最高,總體精度為0.937 2,Kappa系數(shù)為0.923 4,總體精度比SVM和KNN分別提高了5.75%和6.6%,Kappa系數(shù)比SVM和KNN分別提高了7.1%和8.15%。雖然不同分類方法對于單個地物類型分類精度存在差異,總體來說本研究提出的基于多源數(shù)據(jù)特征優(yōu)選的隨機森林算法能夠有效的改善南方丘陵山地分類精度,不同方法分類結(jié)果如圖6所示。

        通過選擇局部分類結(jié)果圖7與谷歌地球高分影像對比可發(fā)現(xiàn),在東江源土地利用分類中誤差主要為園地和耕地的錯分。通過RF優(yōu)選特征分類后得到的結(jié)果耕地和園地生產(chǎn)者精度達(dá)到最高分別為0.90和0.82,用戶精度達(dá)到0.84和0.93,大部分區(qū)域能夠被正確識別,各地物能得到很好的區(qū)分,最終的分類結(jié)果邊界清晰且基本沒有破碎化現(xiàn)象,比較符合東江源實際情況,分類結(jié)果較好。而SVM和KNN分類結(jié)果圖中耕地和園地錯分現(xiàn)象比較多,通過圖7可知基于RF分類的園地生產(chǎn)者精度和用戶精度分別比SVM和KNN提高了11%、15%和11%、17%;耕地生產(chǎn)者精度和用戶精度分別比SVM和KNN提高了13%、16%和13%、14%。雖然現(xiàn)有10m分辨率的全國土地利用產(chǎn)品,其5個一級類和12個二級類總體分類精度分別為61.2%和57.5%[21]。但其是以全國范圍尺度為研究區(qū)域,故存在多樣性、復(fù)雜性,影像的時相難以統(tǒng)一性的問題,研究區(qū)域越大其局部區(qū)域紋理細(xì)節(jié)越難兼顧[31];而通過特征優(yōu)選的隨機森林分類產(chǎn)品是針對東江源地區(qū)中小區(qū)域范圍,相對較注重細(xì)節(jié)紋理,且總體精度達(dá)到0.937 2,Kappa系數(shù)達(dá)到0.923 4,更為符合東江源地表真實情況。

        3 結(jié) 論

        1)在加入紅邊特征、雷達(dá)特征和地形特征后可以有效地提升東江源區(qū)地表土地利用分類精度,相比光譜指數(shù)、植被指數(shù)和水體指數(shù)提取的東江源地表覆蓋分類總體精度分別提高了0.77、1.79和4.27百分點,Kappa系數(shù)則分別提高了0.94、2.18和5.2百分點。

        2)結(jié)合隨機森林法(RF)和遞歸特征消除法(RFE)可以有效的選取對分類精度影響的有效特征變量,在保證分類精度最優(yōu)的同時減少無關(guān)特征變量參與分類,將所有特征變量從21個降低到13個并且總體精度達(dá)到0.937 2,Kappa系數(shù)達(dá)到0.923 4。經(jīng)過特征變量重要性排序得到在東江源光譜特征變量和紅邊特征變量貢獻(xiàn)率較高,分別為26.09%和23.55%;植被指數(shù)和地形特征次之。其中波段B12、紅邊歸一化植被指數(shù)(RNDVI)、比值植被指數(shù)(RVI)對模型的分類影響較大。

        3)優(yōu)選特征后的波段通過使用RF、支持向量機算法(SVM)和K近鄰算法(KNN)3種機器學(xué)習(xí)分類算法進(jìn)行分類可得RF算法的分類精度最高,總體精度為0.937 2比SVM和KNN分別提高了5.75%和6.6%;Kappa系數(shù)為0.923 4比SVM和KNN分別提高了7.1%和8.15%。

        由于東江源區(qū)主要以林地和園地為主,其他地物類型較為破碎,盡管使用RF算法對南方丘陵山地土地利用分類信息提取精度較高,但當(dāng)前分類類別較粗。下一步可以充分利用多源遙感數(shù)據(jù)的優(yōu)勢,將隨機森林模型和面向?qū)ο蠓椒ńY(jié)合,把紋理因素加進(jìn)去對占主體的林地和園地做更細(xì)致的劃分,對隨機森林算法的普適性進(jìn)行更深入的研究。

        [1] 唐華俊,吳文斌,楊鵬,等.土地利用/土地覆被變化(LUCC)模型研究進(jìn)展[J]. 地理學(xué)報,2009,64(4):456-468.

        Tang Huajun, Wu Wenbin, Yang Peng, et al. Recent progresses of land use and land cover change (LUCC) models[J]. Acta Geographica Sinica, 2009, 64(4): 456-468. (in Chinese with English abstract)

        [2] 翟天林,金貴,鄧祥征,等. 基于多源遙感影像融合的武漢市土地利用分類方法研究[J]. 長江流域資源與環(huán)境,2016,25(10):1594-1602.

        Zhai Tianlin, Jin Gui, Deng Xiangzheng, et al. Research of Wuhan City land use classification method based on multi-source remote sensing image fusion[J]. Resources and Environment in the Yangtze Basin, 2016, 25(10): 1594-1602. (in Chinese with English abstract)

        [3] 張宇碩,吳殿廷,呂曉. 土地利用/覆蓋變化對生態(tài)系統(tǒng)服務(wù)的影響:空間尺度視角的研究綜述[J]. 自然資源學(xué)報,2020,35(5):1172-1189.

        Zhang Yushuo, Wu Dianting, Lv Xiao. A review on the impact of land use/land cover change on ecosystem services from a spatial scale perspective[J]. Journal of Natural Resources, 2020, 35(5): 1172-1189. (in Chinese with English abstract)

        [4] 張衛(wèi)春,劉洪斌,武偉. 基于隨機森林和Sentinel-2影像數(shù)據(jù)的低山丘陵區(qū)土地利用分類:以重慶市江津區(qū)李市鎮(zhèn)為例[J]. 長江流域資源與環(huán)境,2019,28(6):1334-1343.

        Zhang Weichun, Liu Hongbin, Wu Wei. Classification of land use in low mountain and hilly area based on random forest and Sentinel-2 satellite data: A case study of Lishi town, Jiangjin, Chongqing[J]. Resources and Environment in the Yangtze Basin, 2019, 28(6): 1334-1343. (in Chinese with English abstract)

        [5] 何云,黃翀,李賀,等. 基于Sentinel-2A影像特征優(yōu)選的隨機森林土地覆蓋分類[J]. 資源科學(xué),2019,41(5):992-1001.

        He Yun, Huang Chong, Li He, et al. Land-cover classification of random forest based on Sentinel-2A image feature optimization[J]. Resources Science, 2019, 41(5): 992-1001. (in Chinese with English abstract)

        [6] Kollert A, Bremer M, Markus L, et al. Exploring the potential of land surface phenology and seasonal cloud free composites of one year of Sentinel-2 imagery for tree species mapping in a mountainous region[J]. International Journal of Applied Earth Observation and Geoinformation, 2021, 94. doi:10.1016/j.jag.2020.102208.

        [7] 蔡文婷,趙書河,王亞梅,等. 結(jié)合Sentinel-2光譜與紋理信息的冬小麥作物茬覆蓋度估算[J]. 遙感學(xué)報,2020,24(9):1108-1119.

        Cai Wenting, Zhao Shuhe, Wang Yamei, et al. Estimation of winter wheat residue cover using spectral and textural information from Sentinel-2 data[J]. Journal of Remote Sensing, 2020, 24(9): 1108-1119. (in Chinese with English abstract)

        [8] Antoine L, Christophe S, Thomas C, et al. Monitoring urban areas with Sentinel-2A data: Application to the update of the copernicus high resolution layer imperviousness degree[J]. Remote Sensing,2016, 8(7): 1-21.

        [9] Markus I, Francesco V, Clement A. First experience with Sentinel-2 data for crop and tree species classifications in central Europe[J]. Remote Sensing,2016, 8(3): 166.

        [10] Pierre D, Douglas J K, Dikaso U, et al. Mapping the dabus wetlands, ethiopia, using random forest classification of Landsat, PALSAR and topographic data[J]. Remote Sensing,2017, 9(10): 1056.

        [11] 郭交,朱琳,靳標(biāo). 基于Sentinel-1和Sentinel-2數(shù)據(jù)融合的農(nóng)作物分類[J]. 農(nóng)業(yè)機械學(xué)報,2018,49(4):192-198.

        Guo Jiao, Zhu Lin, Jin Biao. Crop classification based on data fusion of Sentinel-1 and Sentinel-2[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(4): 192-198. (in Chinese with English abstract)

        [12] van Tricht K, Gobin A, Gilliams S, et al. Synergistic use of radar Sentinel-1 and optical Sentinel-2 imagery for crop mapping: A case study for Belgium[J]. Remote Sensing, 2018, 10(10): 1642.

        [13] Tavares P A, Beltr?o N E S, Guimar?es U S, et al. Integration of Sentinel-1 and Sentinel-2 for classification and LULC mapping in the urban area of belém, eastern brazilian amazon[J]. Sensors, 2019, 19(5): 1140.

        [14] Slagter B, Tsendbazar N E, Vollrath A, et al. Mapping wetland characteristics using temporally dense Sentinel-1 and Sentinel-2 data: A case study in the St. Lucia wetlands, South Africa[J]. International Journal of Applied Earth Observations and Geoinformation, 2020, 86:102009.

        [15] Wang H, Liu C L, Zang F, et al. Impacts of topography on the land cover classification in the Qilian Mountains, Northwest China[J]. Canadian Journal of Remote Sensing, 2020, 46(3): 344-359.

        [16] Talukdar S, Singha P, Mahato S, et al. Land-use land-cover classification by machine learning classifiers for satellite observations: A review[J]. Remote Sensing, 2020, 12(7): 1135.

        [17] Frank T, Stefanie S, Javier M, et al. Long-term land use/land cover change assessment of the Kilombero Catchment in Tanzania using random forest classification and robust change vector analysis[J]. Remote Sensing, 2020, 12(7): 1057.

        [18] 馬玥,姜琦剛,孟治國,等. 基于隨機森林算法的農(nóng)耕區(qū)土地利用分類研究[J]. 農(nóng)業(yè)機械學(xué)報,2016,47(1):297-303.

        Ma Yue, Jiang Qigang, Meng Zhiguo, et al. Classification of land use in farming area based on random forest algorithm[J]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(1): 297-303. (in Chinese with English abstract)

        [19] Abdi A M. Land cover and land use classification performance of machine learning algorithms in a boreal landscape using Sentinel-2 data[J]. GIScience & Remote Sensing, 2020, 57(1): 1-20.

        [20] 常文濤,王浩,寧曉剛,等. 融合Sentinel-2紅邊波段和Sentinel-1雷達(dá)波段影像的扎龍濕地信息提取[J]. 濕地科學(xué),2020,18(1):10-19.

        Chang Wentao, Wang Hao, Ning Xiaogang, et al. Extraction of Zhalong wetlands information based on images of Sentinel-2 red-edge bands and Sentinel-1 radar bands[J]. Wetland Science, 2020, 18(1): 10-19. (in Chinese with English abstract)

        [21] Gong P, Chen B, Li X C, et al. Mapping essential urban land use categories in China (EULUC-China): Preliminary results for 2018[J]. Science Bulletin, 2020, 65(3): 182-187.

        [22] Yang Y K, Xiao P F, Feng X Z, et al. Accuracy assessment of seven global land cover datasets over China[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 125: 156-173.

        [23] 李恒凱,吳嬌,王秀麗. 基于GF-1影像的東江流域面向?qū)ο笸恋乩梅诸怺J]. 農(nóng)業(yè)工程學(xué)報,2018,34(10):245-252.

        Li Hengkai, Wu Jiao, Wang Xiuli. Object oriented land use classification of Dongjiang River Basin based on GF-1 image[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(10): 245-252. (in Chinese with English abstract)

        [24] Forkuor G, Dimobe K, Serme I, et al. Landsat-8 vs. Sentinel-2: Examining the added value of sentinel-2’s red-edge bands to land-use and land-cover mapping in Burkina Faso[J]. GIScience & Remote Sensing, 2018, 55(3): 331-354.

        [25] Hütt C, Waldhoff G, Bareth G. Fusion of Sentinel-1 with official topographic and cadastral geodata for crop-type enriched LULC mapping using FOSS and open data[J]. International Journal of Geo-Information, 2020, 9(2): 120.

        [26] 王李娟,孔鈺如,楊小冬,等. 基于特征優(yōu)選隨機森林算法的農(nóng)耕區(qū)土地利用分類[J]. 農(nóng)業(yè)工程學(xué)報,2020,36(4):244-250.

        Wang Lijuan, Kong Yuru, Yang Xiaodong, et al. Classification of land use in farming areas based on feature optimization random forest algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(4): 244-250. (in Chinese with English abstract)

        [27] 梁繼,鄭鎮(zhèn)煒,夏詩婷,等. 高分六號紅邊特征的農(nóng)作物識別與評估[J]. 遙感學(xué)報,2020,24(10):1168-1179.

        Liang Ji, Zheng Zhenwei, Xia Shiting, et al. Crop recognition and evaluationusing red edge features of GF-6 satellite[J]. Journal of Remote Sensing, 2020, 24(10): 1168-1179. (in Chinese with English abstract)

        [28] Breiman L. Random forest[J]. Machine Learning, 2001, 45(1): 5-32.

        [29] Tucker C J. Remote sensing of leaf water content in the near infrared[J]. Remote Sensing of Environment, 1980, 10(1): 23-32.

        [30] Li W, Michael H. Coastal wetland mapping using ensemble learning algorithms: A comparative study of bagging, boosting and stacking techniques[J].Remote Sensing, 2020, 12(10): 1683.

        [31] 阮永儉,邱玉寶,李恒凱,等. 近26年贛州地區(qū)陸表環(huán)境遙感與變化分析[J]. 遙感信息,2016,31(6):110-120.

        Ruan Yongjian, Qiu Yubao, Li Hengkai, et al. Land cover and ecological assessment of Ganzhou region in recent 26 years by remote sensing[J]. Remote Sensing lnformation, 2016, 31(6): 110-120. (in Chinese with English abstract)

        Random forest classification of land use in hilly and mountaineous areas of southern China using multi-source remote sensing data

        Li Hengkai, Wang Lijuan, Xiao Songsong

        (341000)

        Land use has been critical to global environmental change and structure adjustment, particularly to the sustainable development of land resources. However, there are complex terrains, broken distribution of ground objects, as well as the cloudy and rainy weather in hilly and mountainous areas of southern China. High-resolution optical remote sensing data is still lacking for the effective and accurate extraction of land use information. Therefore, the use of multi-source remote sensing data can achieve complementary advantages between remote sensing data and classification accuracy. The Sentinel series of remote sensing satellites launched by the European Space Agency (ESA) can provide new data sources for land-use change research. Multi-dimensional features can be adopted for the land use classification using the Sentinel-2A with red edge characteristics and Sentinel-1 with the nearly fog-free performance. Taking the reaches of Dongjiang River in Jiangxi Province of China as the study area, 9 schemes were designed in the Random Forest (RF) classification of land use to explore the effect of red edge, radar and terrain features on the extracting accuracy in hilly and mountainous areas of South China. In this study, the satellite images from the Sentinel-1, Sentinel-2 and digital elevation model (DEM) were combined to extract 27 feature indices, and then to construct 6 feature variable sets. The RF and Recursive Feature Elimination (RFE) were coupled to rank the importance of feature variables for the optimal one. The classification data from the RF feature selection was compared with the Support Vector Machine (SVM) and K-Nearest Neighbor (KNN). The results showed that the Sentinel-2A spectral features extraction presented the lowest overall accuracy and Kappa coefficient of land use classification in the study area, when the feature variables were not optimized. The addition of red edge, radar and topographic features effectively improved the classification accuracy, when the spectral features, vegetation and water indices were taken as basic schemes. Specifically, the overall accuracy increased by 0.77, 1.79, and 4.27 percentage points, respectively, while, the Kappa coefficient increased by 0.94, 2.18, and 5.2 percentage points, respectively. The topographic features more contributed to the extraction of orchard and cultivated land information in the study area. The RF and recursive feature elimination were combined to optimize all the feature variables from 21 to 13 with an overall accuracy of 0.937 2 and Kappa coefficient of 0.923 4, while maintaining the optimal classification accuracy. There were relatively significant contribution rates of spectral and red edge features variables, which were 26.09% and 23.55%, respectively. The vegetation and topographic indices were then followed in the importance of feature variables. The RF classification depended mainly on the short infrared band of B12, Relative Normalized Difference Vegetation Index (RNDVI) and Ratio Vegetation Index (RVI).The overall accuracy of RF was 0.937 2, 5.75% and 6.6% higher than that of SVM and KNN, respectively, whereas, Kappa coefficient was 0.923 4, 7.1% and 8.15% higher than SVM and KNN, respectively, indicating that the RF classification accuracy was superior to SVM and KNN with the same features. Therefore, the RF classification using the multi-source data can provide a promising technical support and theoretical reference for the extraction of land use in the hilly and mountainous regions of South China.

        land use; classification; hilly mountain; random forest algorithm; multi-source remote sensing data; Sentinel-2A; Sentinel-1

        2021-01-10

        2021-03-13

        教育部人文社會科學(xué)研究規(guī)劃項目(18YJAZH040);江西省教育廳科學(xué)技術(shù)研究重點項目(GJJ180423);江西省高校人文社會科學(xué)研究項目(JC20119)

        李恒凱,博士,副教授,主要研究方向為遙感建模與分析。Email:giskai@126.com

        10.11975/j.issn.1002-6819.2021.07.030

        P237

        A

        1002-6819(2021)-07-0244-08

        李恒凱,王利娟,肖松松. 基于多源數(shù)據(jù)的南方丘陵山地土地利用隨機森林分類[J]. 農(nóng)業(yè)工程學(xué)報,2021,37(7):244-251. doi:10.11975/j.issn.1002-6819.2021.07.030 http://www.tcsae.org

        Li Hengkai, Wang Lijuan, Xiao Songsong. Random forest classification of land use in hilly and mountaineous areas of southern China using multi-source remote sensing data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(7): 244-251. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2021.07.030 http://www.tcsae.org

        猜你喜歡
        分類特征
        抓住特征巧觀察
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        新型冠狀病毒及其流行病學(xué)特征認(rèn)識
        如何表達(dá)“特征”
        不忠誠的四個特征
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        抓住特征巧觀察
        精品国产一二三产品区别在哪| 亚洲国产综合久久精品 | 免费看av网站在线亚洲| 东北少妇不戴套对白第一次| 国产欧美日韩久久久久| av深夜福利在线| 操国产丝袜露脸在线播放| 精品国产三级a∨在线欧美| 人人爽人人爱| 青青草视频网站免费观看| 成人影院视频在线播放| 欧洲熟妇色xxxx欧美老妇软件| 特黄a级毛片免费视频| 亚洲欧美日韩高清一区二区三区 | 91亚洲欧洲日产国码精品| 成年人视频在线观看麻豆| 国产亚洲美女精品久久久2020| 久久久久亚洲av无码专区| 国产粉嫩嫩00在线正在播放| 一区二区三区日韩精品视频| 各种少妇正面着bbw撒尿视频| 中文亚洲日韩欧美| 国产精东一区二区三区| 亚洲在线视频免费视频| 又粗又硬又黄又爽的免费视频 | 中文字幕人妻av四季| 无码专区亚洲综合另类| 亚洲国产高清在线一区二区三区 | 亚洲av无码一区二区三区鸳鸯影院| 欧美尺寸又黑又粗又长| 久久久久久免费播放一级毛片| 中文字幕一区二区三区日日骚| 国语对白做受xxxxx在| 欧美在线综合| 伊人久久综合狼伊人久久| 欧美肥妇毛多水多bbxx水蜜桃 | 国产极品嫩模大尺度在线播放| 日日噜噜夜夜狠狠久久丁香五月| 影视先锋av资源噜噜| 久久AⅤ天堂Av无码AV| 富婆猛男一区二区三区|