亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林算法的多作物同步識別

        2019-08-03 07:16:06許淇李啟亮MathildeDeVroey張吳平范錦龍
        山東農(nóng)業(yè)科學(xué) 2019年3期
        關(guān)鍵詞:隨機(jī)森林時間序列

        許淇 李啟亮 Mathilde De Vroey 張吳平 范錦龍

        摘要:作物類型遙感識別是農(nóng)業(yè)遙感的重要組成部分,為獲取作物種植面積、長勢信息并進(jìn)行產(chǎn)量估算提供了手段。目前,對玉米、水稻和小麥等大宗農(nóng)作物進(jìn)行單一識別或兩類間分類識別的技術(shù)研究較多,對研究區(qū)多種農(nóng)作物同步分類識別的研究較少。本研究基于隨機(jī)森林分類器利用Landsat 8數(shù)據(jù)開展寧夏農(nóng)作物分類,對八種主要農(nóng)作物春小麥、玉米、水稻、苜蓿、蔬菜、葡萄、枸杞和瓜類進(jìn)行同步分類試驗(yàn)。結(jié)果表明:隨機(jī)森林方法可以滿足研究區(qū)內(nèi)多類作物同步監(jiān)測的需求,精度可達(dá)80%以上。單時相分類精度可達(dá)到81.8%,后分類處理精度可達(dá)到82.8%,時間序列分類精度可達(dá)到85.1%,時間序列分類和后分類處理可以有效提高分類精度。隨機(jī)森林分類精度隨著樹數(shù)量的增加而增大,當(dāng)樹的數(shù)量足夠多時,模型趨于穩(wěn)定,特征變量對精度的影響被控制在一定范圍內(nèi),當(dāng)特征變量設(shè)置為總特征變量的平方根或?qū)?shù)時,精度達(dá)到最佳。因此,基于對分類實(shí)驗(yàn)時效性的考慮,將參數(shù)分別設(shè)置為Ntree= 100,Mtry=總特征變量的平方根或?qū)?shù)。

        關(guān)鍵詞:隨機(jī)森林;多作物識別;分類后處理;單時相;時間序列

        Multi - Crop Synchronization Identification Based on Random ForestXu Qjl,2 , Li Qjliang1,2 , Mathilde De Vroey3 , Zhang Wupingl , Fan Jinlong2

        Abstract Identifying crop type with remotely sensed image is the fundamental step for calculating croparea and monitoring crop growth as well as estimating crop yield in the context of agricultural remote sensing.At present, there were many studies on single recognition or inter - classification recognition among the majorstaple crops, such as corn, rice and wheat, however, less researches have been done on simultaneous classifi-cation and recognition of multiple crops in the study area. Based on the random forest classifier and Landsat 8data, this study carried out the crop classification in Ningxia, the crops including rice, corn, wheat, clover,grapes, alfalfa, vegetables and melons. The results showed that it was feasible to use the random forest methodto simultaneously identify multiple crops in Ningxia, and the accuracy could reach more than 80%. Thesingle - phase classification accuracy could reach 81.8% , after classification post - processing accuracy couldbe up t0 82.8% . The time series classification accuracy could reach 85.1% . Time series classification andpost - classification processing could effectively improve classification accuracy. The accuracy of random forestclassification increased with the increase of the number of trees. The model tended to be stable when the num-ber of trees was sufficient, and the influence of characteristic variables on the accuracv was controlled within acertain range. The precision was optimal when the feature variable was set to the square root or logarithm ofthe total feature variable. Therefore, based on the consideration of the timeliness of the classification experi-ment, the parameters were respectively set to Ntree = 100, and Mtry = the square root or logarithm of the totalcharacteristic variable.

        Keywords Random forest; Multi - crop classification; Post - classification; Single - phase; Time series

        掌握農(nóng)作物種植的空間分布狀況,對于宏觀指導(dǎo)農(nóng)業(yè)生產(chǎn)、合理采取作物管理措施具有重要的現(xiàn)實(shí)意義[1-3]。傳統(tǒng)的農(nóng)業(yè)統(tǒng)計(jì)報(bào)表和抽樣調(diào)查,通常需耗費(fèi)大量人力物力且持續(xù)時間長[4],對當(dāng)季農(nóng)業(yè)生產(chǎn)的指導(dǎo)作用有限。遙感技術(shù)具有觀測面積大、觀測周期短、數(shù)據(jù)的綜合性和可比性較強(qiáng)等特點(diǎn),為及時、準(zhǔn)確、客觀地獲得作物種植面積提供了技術(shù)手段和重要基礎(chǔ)數(shù)據(jù)[5,6]。近年來較主流的作物分類方法包括支持向量機(jī)(SVM)、隨機(jī)森林(RF)、神經(jīng)網(wǎng)絡(luò)(ANN)、K近鄰法( KNN)、決策樹(DT)、最大似然法(MLC),其中支持向量機(jī)與隨機(jī)森林應(yīng)用最為廣泛[7]。

        隨機(jī)森林算法是由多棵CART決策樹組合而成的一種監(jiān)督分類方法,構(gòu)成決策樹模型的數(shù)據(jù)是通過Bootstrap方法隨機(jī)抽取的,抽取剩余的數(shù)據(jù)即袋外數(shù)據(jù)則用于誤差測試,最終分類結(jié)果由多棵決策樹投票決定。隨機(jī)森林分類器具有對參數(shù)不敏感,不易過擬合,訓(xùn)練速度快的特點(diǎn)[8]。眾多研究者已基于隨機(jī)森林算法在作物分類領(lǐng)域進(jìn)行了研究并取得了較好的精度[4.9-11]。但現(xiàn)有的研究大多針對大宗農(nóng)作物進(jìn)行單一提取或兩類間進(jìn)行分類識別,并未進(jìn)行研究區(qū)全部主要作物的同步提取試驗(yàn),無法滿足我國地塊破碎、作物種類繁多的現(xiàn)實(shí)性需求。

        本研究以寧夏青銅峽灌區(qū)為研究區(qū),采用隨機(jī)森林分類器對研究區(qū)種植的八種主要農(nóng)作物——春小麥、玉米、水稻、苜蓿、蔬菜、葡萄、枸杞和瓜類進(jìn)行同步分類試驗(yàn),分析Ntree和Mtry對隨機(jī)森林模型精度的影響,單時相與時間序列、后分類處理對分類結(jié)果的影響,最后評估了隨機(jī)森林算法在多作物同步提取中的實(shí)用性,為實(shí)現(xiàn)我國多作物同步監(jiān)測提供依據(jù)。

        1 數(shù)據(jù)來源與研究方法

        1.1 研究區(qū)概況

        研究區(qū)位于寧夏回族自治區(qū)內(nèi)的青銅峽灌區(qū)(石嘴山市、銀川市和吳忠市),地理位置東經(jīng)105. 39°~107.00°、北緯37.49°~39.27°。位于中溫帶干旱區(qū),日照充足,溫差大,熱量豐富,無霜期較長。年均氣溫8—9℃,4-9月作物生長季累計(jì)積溫3200—3400℃,大于等于10℃積溫的初日及終日與無霜期吻合,再加上太陽輻射達(dá)619.68J/(c㎡·a),有利于作物生長。灌區(qū)主要作物有春小麥、玉米、水稻、苜蓿、蔬菜、葡萄、枸杞和瓜類。

        1.2 數(shù)據(jù)源

        1.2.1 影像數(shù)據(jù)本研究所用的主要數(shù)據(jù)源為30M分辨率的Landsat 8衛(wèi)星數(shù)據(jù),包括9個波段,分別是海岸/氣溶膠、藍(lán)、綠、紅、近紅、短波紅外1、短波紅外2、熱紅外1和熱紅外2。對影像進(jìn)行預(yù)處理操作后的計(jì)算又增加了歸一化植被指數(shù)(NDVI)、歸一化水體指數(shù)(NDWI)、歸一化建筑指數(shù)( NDBI)信息數(shù)據(jù),共12個波段。

        共獲取了13期Landsat 8衛(wèi)星影像數(shù)據(jù),時間分別為2018-05-04、2018-05-11、2018-05-20、2018-05-27、2018-06-05、2018-06-12、2018-06-21、2018-06-28、2018-07-14、2018-07-30、2018-08-08、2018-08-15、2018-08-24。但只有2018-06-05、2018-06-21及2018-08-24三幅完整覆蓋研究區(qū),而由于小麥生長期只持續(xù)到7月,故選用2018-06-05及2018-06- 21影像進(jìn)行分類,其他時間的影像用于輔助樣本點(diǎn)的擴(kuò)充。

        本研究還用到了10 m分辨率的Sentinel-2數(shù)據(jù)[12-14],主要用于工作者B選取驗(yàn)證樣本及結(jié)合哨兵農(nóng)業(yè)系統(tǒng)(Sen2-Agri)。[15-17]生成研究區(qū)作物分區(qū)圖。

        1.2.2 地面調(diào)查數(shù)據(jù) 于2018年6月7-8日及6月28日-7月3日分別進(jìn)行實(shí)地樣方采集工作。采用野外沿途拍照采樣與室內(nèi)解譯相結(jié)合的方法,在研究區(qū)內(nèi)選取11個10 kmxlo km的采樣框,在采樣框中進(jìn)行密集型采樣,采樣框之間則采取跟隨車的行進(jìn)路線進(jìn)行隨機(jī)拍照采樣的方式來增加樣本的采集。在采樣過程中分左右兩個方向進(jìn)行拍照采樣,采集了7950多個左側(cè)地面樣方照片數(shù)據(jù),5330多個右側(cè)地面樣方照片數(shù)據(jù)。

        訓(xùn)練樣本采用背對背選取方式,左邊工作者A實(shí)地樣本用來在Landsat 8數(shù)據(jù)上采集擴(kuò)充訓(xùn)練樣本,右邊工作者B實(shí)地樣本用來在Sentinel -2數(shù)據(jù)上采集驗(yàn)證樣本以及借助哨兵農(nóng)業(yè)系統(tǒng)(Sen2 - Agri)生成研究區(qū)作物分區(qū)圖。訓(xùn)練樣本及驗(yàn)證樣本量如表1。

        1.3 研究方法

        1.3.1 隨機(jī)森林算法 隨機(jī)森林算法(RFC)是Breiman[18]2001年提出的一種多決策樹分類方法,是監(jiān)督分類方法的一種。隨機(jī)森林算法的分類結(jié)果由構(gòu)成模型的所有CART決策樹投票決定,而構(gòu)成每個決策樹模型的樣本數(shù)據(jù)和特征變量都是隨機(jī)抽取的結(jié)果,同時會將剩余的數(shù)據(jù)組成袋外數(shù)據(jù)進(jìn)行誤差測試。由于每次構(gòu)建模型時的數(shù)據(jù)與特征變量都是隨機(jī)選取,故每次構(gòu)建的模型和分類結(jié)果不完全一樣,會存在一定的誤差值。隨機(jī)森林方法對于遙感影像分類具有很好的抗噪聲性能,分類精度較高[9]。

        隨機(jī)森林算法通過IDL語言實(shí)現(xiàn),有兩個重要參數(shù)需要設(shè)定,分別為決策樹的數(shù)量(Ntree)和特征變量的數(shù)量(Mtry)。為找出最佳分類參數(shù),本研究分別將樹數(shù)量設(shè)置為10、50、100、300、500、1000,特征變量以1為步長,分別對12個波段進(jìn)行分類驗(yàn)證,結(jié)果發(fā)現(xiàn)分類精度隨著決策樹數(shù)量的增加而增大,當(dāng)樹的數(shù)量達(dá)到100時分類精度趨于平穩(wěn)狀態(tài),誤差保持在一個精度的范圍內(nèi);當(dāng)樹的數(shù)量足夠多時(達(dá)到100),特征變量對分類精度的影響被控制在一定范圍內(nèi),當(dāng)特征變量設(shè)置為總特征變量的平方根或?qū)?shù)時,精度達(dá)到最佳。因此,基于對分類實(shí)驗(yàn)時效性的考慮,本研究將參數(shù)分別設(shè)置為Ntree=100,Mtrv=3。

        根據(jù)隨機(jī)森林算法參數(shù)調(diào)試結(jié)果對分類器進(jìn)行設(shè)定,采用訓(xùn)練樣本數(shù)據(jù)分別對影像分三種情景進(jìn)行討論:①2018-06-05單時相影像;②后分類處理,對2018-06-05分類結(jié)果中蔬菜及水稻兩類進(jìn)行3x3窗口的Majority和Clump分類后處理;③時間序列影像。最終得到研究區(qū)作物分類圖。圖1為三種情景討論結(jié)果的部分細(xì)節(jié)展示。

        1.3.2 精度驗(yàn)證采用工作者B根據(jù)實(shí)地采樣照片基于10 m空間分辨率哨兵影像得到的樣本點(diǎn)作為研究結(jié)果精度驗(yàn)證的數(shù)據(jù),共計(jì)19027個驗(yàn)證點(diǎn)(表1)。采用混淆矩陣、Kappa系數(shù)、總體分類精度、用戶者精度、制圖者精度[19]和F1Score 6種方式描述和比較分類精度。

        2 結(jié)果與分析

        2.1 分類后處理

        對2018年6月5日的單日影像分類結(jié)果先后進(jìn)行Majority和Clump方式的分類后處理。由于研究區(qū)北部地塊破碎,主要以種植玉米和小麥為主,枸杞和葡萄也存在相鄰小塊種植的現(xiàn)象,故為了避免分類后處理給分類結(jié)果帶來失真影響,只對大面積種植的水稻和蔬菜進(jìn)行分類后處理,Majority和Clump的處理窗口分別為3x3和2×2,表2展示了處理前后影像及混淆矩陣。經(jīng)分類后處理,總體精度、Kappa系數(shù)、F1 Score分別較處理前提高了約1個精度范圍;每種作物的F1Score都略有提高,蔬菜最為明顯,提高了約4個精度值。

        2.2 單時相與時間序列影像分類對比

        2018年6月5日單時相影像分類結(jié)果總體精度81.8%,Kappa系數(shù)0.76,F(xiàn)1 Score 68.58%。采用2018年6月5日與6月21日時間序列影像的分類結(jié)果總體精度可達(dá)85.1%,Kappa系數(shù)為0.81,F(xiàn)1 Score為74.09%(表3)。兩種影像分類結(jié)果中枸杞的精度都較低,F(xiàn)1 Score只有20%左右,可能是由于訓(xùn)練樣本較少以及枸杞種植區(qū)分散且多與葡萄相鄰造成混淆。相較于單時相影像分類結(jié)果,總體精度提高了3.3個百分點(diǎn),苜蓿、玉米、葡萄、枸杞、瓜類、水稻、蔬菜的F1 Score分別提高了2.1、5.5、9.3、6.O、18.4、1.1、2.6個百分點(diǎn),小麥的F1 Score降低了1.1個百分點(diǎn)??傮w來看,時間序列影像分類可有效提高作物分類精度。從細(xì)節(jié)圖(圖1)來看,時間序列影像分類較單時相分類可以較好地處理地塊邊界問題,并有效避免因地塊短期管理問題造成的地塊內(nèi)部個別像素錯分誤分的現(xiàn)象。

        3 討論與結(jié)論

        基于隨機(jī)森林方法對寧夏種植的多種作物進(jìn)行同步分類提取,總體精度達(dá)到81%以上,且分類結(jié)果與灌區(qū)北部地塊破碎、中北部地塊較大、南部地塊適中、葡萄主要分布于西部的實(shí)地作物空間分布一致,滿足了多類作物同步監(jiān)測的需求。主要研究結(jié)果及存在問題如下:

        (1)分類精度隨決策樹數(shù)量的增加而增大,當(dāng)樹的數(shù)量達(dá)到100時分類精度趨于平穩(wěn)狀態(tài)。當(dāng)樹的數(shù)量足夠多(達(dá)到100)時,特征變量對分類精度的影響被控制在一定范圍內(nèi),當(dāng)特征變量設(shè)置為總特征變量的平方根或?qū)?shù)時,精度達(dá)到最佳。因此,基于對分類實(shí)驗(yàn)時效性的考慮,建議將參數(shù)分別設(shè)置為Ntree=100,Mtrv=總特征變量的平方根或?qū)?shù)。

        (2)時間序列影像可以有效提高分類精度,與單時相影像分類相比,可以較好地處理地塊邊界問題,并有效避免因地塊短期管理問題造成的地塊內(nèi)部個別像素錯分誤分現(xiàn)象。由于本研究區(qū)有效數(shù)據(jù)較少,分類精度與有效數(shù)據(jù)數(shù)量是否存在正相關(guān)關(guān)系還需進(jìn)一步探索。

        (3)由于苜蓿、蔬菜在生長季內(nèi)存在收割一生長多次反復(fù)的現(xiàn)象,故可能與玉米產(chǎn)生一定的混淆;而葡萄因種植模式導(dǎo)致植被覆蓋度低,易與生長初期的玉米產(chǎn)生一定混淆。故在今后的研究中應(yīng)嘗試分層提職來改善作物的混淆問題。

        (3)對大地塊地物進(jìn)行適當(dāng)窗口大小的Ma-jority和Clump分類后處理,可以有效解決地塊內(nèi)部個別像元的錯分誤分問題,從而小程度地提高分類精度。部分地區(qū)由于地塊破碎程度嚴(yán)重,分類結(jié)果呈現(xiàn)麻點(diǎn)分布,對整個研究區(qū)的主要作物同時進(jìn)行分類處理會導(dǎo)致失真現(xiàn)象,今后應(yīng)尋求更便捷的分類處理方法以避免此類問題。

        參考文獻(xiàn):

        [1] Wessels K J, Reyers B, Jaarsveld A s V, et al. Identification ofpotential conflict areas between land transformation and biocliversi-ty conservation in north - eastem South Africa [J] . AgTiculture,Ecosystems & Environment . 2003 . 95 (1) : 157 - 178.

        [2] Fry J, Xian G Z. Jin S, et al. Completion of the 2006 NationalLand Cover Database for the contermious United States [ JlPhotogramm. Eng. Remote Sens. . 2011 . 77 :858 - 864.

        [3] Guidici D. Clark M L. One - dimensional convolutional neuralnetwork land - cover classification of multiseasonal hyperspec-tral imagery in the San Francisco Bav Area. Califomia [Jl.Remote Sens., 2017.9(6):629.

        [4] 黃健熙,侯矞焯,蘇偉,等.基于GF -1 WFV數(shù)據(jù)的玉米與大豆種植面積提取方法[J].農(nóng)業(yè)工程學(xué)報(bào),2017,33(7):164 -170.

        [5] Topalo g R H, Sertel E. Musao g N.Assessment of classifica-tion accuracies of Sentinel -2 and Landsat -8 data for landcover/use mapping[J]. DOI: 10. 5194/isprs - archives -XLI - B8 - 1055 - 2016.

        [6] Khatami R. Mountrakis G,Stelunan S V.A meta - analvsis ofremote sensing research on supervised pixel - based Iand - cov-er image classification processes: general guidelines for practi-tioners and future research[J]. Remote Sensing of Environ-merit, 2016, 177: 89 - 100.

        [7] Than T N,Kappas M. Comparison of random forest,k- nearestneighbor, and support vector machine classifiers for land coverclassification using Sentinel -2 imagery[J].Sensors. 2018,18(1):18.

        [8] 崔小芳,劉正軍.基于隨機(jī)森林分類方法和多源遙感數(shù)據(jù)的濕地植被精細(xì)分類[J].測繪與空間地理信息,2018,41(8):113 -116.

        [9] 王利民,劉佳,楊玲波,等.隨機(jī)森林方法在玉米一大豆精細(xì)識別中的應(yīng)用[J].作物學(xué)報(bào),2018, 44(4):569 -580.

        [10]王娜,李強(qiáng)子,杜鑫,等.單變量特征選擇的蘇北地區(qū)主要農(nóng)作物遙感識別[J].遙感學(xué)報(bào),2017, 21(4):519 -530.

        [11] 高夢婕,姜群鷗,趙一陽,等.基于(F-2遙感影像的塑料大棚提取方法對比[J].中國農(nóng)業(yè)大學(xué)學(xué)報(bào),2018,23(8):125 -134.

        [12] ESA. Sentinel -2 User Handbooks[M].ESA, 2015.[13] US(.S (2017) Landsat Missions[K/OL]. United States Geo-logical Survey. 2017.

        [14] Martins V S,Barbosa C C F,De Carvalho L A S,et al.As-sessment of atmospheric correction methods for Sentinel -2 MSIimages applied to Amazon Floodplain Lakes[J].Remote Sens-ing,2017,9(4):322.

        [15] Grizonnet M. Michel J,Poughon V,et al.Orfeo TooIBox:open source processing of remote sensing images [J]. OpenGeospatial Data. Software and Standards. 2017(2): 15.

        [16] ESA Sentinel Online. Sentinel -2:Operations Ramp - UpPhase[K/OL]. https://sentinel. esa. int/web/sentinel/mis-sions/sentinel - 2/operations - ramp - up - phase. 2015 -08 - 21.

        [17] Sentinel -2 for Agriculture. The SEN2 - AGRI System: toserve the exploitation of Sentinel -2 for local to national opera-tional agriculture monitoring [K/OL].http://www. esa -sen2agri. org/. 2015 - 09 - 18.

        [18] Breiman L.Random forests[J].Machine Learning, 2001,45:5-32.

        [19] Congalton R G.A review of assessing the accuracv of classifica-tions of remotelv sensed data[J].Remote Sensing of Environ-ment. 1991, 37(1):35 -46.

        猜你喜歡
        隨機(jī)森林時間序列
        隨機(jī)森林在棉蚜蟲害等級預(yù)測中的應(yīng)用
        基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
        軟件(2016年7期)2017-02-07 15:54:01
        拱壩變形監(jiān)測預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
        上證綜指收益率的影響因素分析
        時代金融(2016年27期)2016-11-25 17:21:02
        基于指數(shù)平滑的電站設(shè)備故障時間序列預(yù)測研究
        基于時間序列的我國人均GDP分析與預(yù)測
        商(2016年32期)2016-11-24 16:20:57
        基于隨機(jī)森林算法的飛機(jī)發(fā)動機(jī)故障診斷方法的研究
        基于線性散列索引的時間序列查詢方法研究
        軟件工程(2016年8期)2016-10-25 15:43:57
        基于組合模型的能源需求預(yù)測
        公眾預(yù)期與不良貸款
        商情(2016年11期)2016-04-15 20:25:31
        狠狠色狠狠色综合网老熟女 | 李白姓白白又白类似的套路 | 无码啪啪人妻| 国产 无码 日韩| 国产精品国产三级农村妇女| 国产三级不卡在线观看视频| 美腿丝袜在线一区二区| 我和丰满妇女激情视频| 人妻熟妇乱又伦精品hd| 国产精品久久久久久| 蜜臀亚洲av无码精品国产午夜.| 国产一区二区三精品久久久无广告 | 67194熟妇在线永久免费观看 | 久久亚洲av成人无码国产| 在线偷窥制服另类| 日韩亚洲精选一区二区三区| av影院在线免费观看不卡| 亚洲av无码一区东京热久久| 国内精品久久久人妻中文字幕| 国产后入又长又硬| 女人下面毛多水多视频| 国产午夜福利小视频合集| 一本一本久久a久久精品综合| 欧美亚洲另类国产18p| 精品人妻久久av中文字幕| 亚洲中文字幕综合网站| 国产精品女直播一区二区| 人妻熟女一区二区三区app下载| 亚洲日韩精品国产一区二区三区| 女人被躁到高潮嗷嗷叫免费软| 亚洲一区二区三区在线最新| 国内自拍偷国视频系列| 国产情侣一区二区| av免费网址在线观看| 亚洲av无码国产剧情| 久久狠狠高潮亚洲精品暴力打| 精品无吗国产一区二区三区av | 亚洲视频在线播放免费视频| 国产av丝袜熟女丰满一区二区| 国内少妇毛片视频| 人人爽久久涩噜噜噜丁香|