亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林和Landsat8 OLI影像的 臍橙果園種植信息提取

        2021-12-03 07:29:16娜,王偉*,王
        地理空間信息 2021年11期
        關(guān)鍵詞:分類特征

        林 娜,王 偉*,王 斌

        (1.重慶交通大學(xué) 土木工程學(xué)院,重慶 400074;2.重慶市地理信息和遙感應(yīng)用中心,重慶 401147)

        臍橙因其可食性高、易貯藏和市場廣闊等特點(diǎn),在我國江西、福建、重慶等紅壤丘陵區(qū)被廣泛種植。重慶奉節(jié)是我國重要的臍橙生產(chǎn)區(qū),2009年被授予 “中國橙都”稱號,臍橙果業(yè)發(fā)達(dá),品種豐富。20世紀(jì)以來,地方政府整合資源大力發(fā)展臍橙產(chǎn)業(yè),極大地促進(jìn)了地方經(jīng)濟(jì)增長。但是,大規(guī)模種植臍橙果園,對于地區(qū)生物多樣性和地表土壤的能量平衡都會產(chǎn)生一定影響。傳統(tǒng)果園種植模式的粗放性,不僅會造成土壤污染、土壤結(jié)構(gòu)破損,而且會引發(fā)較嚴(yán)重的水土流失現(xiàn)象,對地區(qū)生態(tài)環(huán)境構(gòu)成重大威脅[1-3]。傳統(tǒng)方法采取走訪調(diào)查的方式獲取果園種植信息,需耗費(fèi)大量的人力物力,且易受主觀因素的影響;而遙感技術(shù)具有重返快、覆蓋廣和成本低等特點(diǎn)[4],可實(shí)時準(zhǔn)確地獲取臍橙果園的空間分布信息,能為當(dāng)?shù)氐霓r(nóng)業(yè)政策制定提供支持。

        目前,SVM、神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林等機(jī)器學(xué)習(xí)分類算法已在遙感信息提取方面得到了廣泛應(yīng)用[5-7],其中,隨機(jī)森林算法具有人工干預(yù)少、運(yùn)算速度快、魯棒性強(qiáng)等優(yōu)點(diǎn)[8]。顧海燕[9]等利用WorldView-2高分辨率衛(wèi)星遙感影像構(gòu)建了基于隨機(jī)森林算法的分類模型,從而提取了地表覆蓋信息,并與SVM方法進(jìn)行了對比,結(jié)果表明該方法具有更快的運(yùn)算速度和更高的分類精度;呂杰[10]等將SVM、最小距離法、隨機(jī)森林算法3種分類模型應(yīng)用于GF-1號衛(wèi)星遙感數(shù)據(jù)的森林樹種分類研究中,結(jié)果表明隨機(jī)森林算法具有較高的適用性;馬玥[11]等基于隨機(jī)森林分類模型對齊齊哈爾地區(qū)的Landsat8 OLI數(shù)據(jù)進(jìn)行了土地利用信息分類研究,分類精度較SVM、MLC方法有較大的提 高;任傳帥[12]等利用GF-2號高分辨率影像和隨機(jī)森林算法成功提取了海南北部的香蕉林信息;宋榮杰[13]等結(jié)合小波紋理分析和隨機(jī)森林算法較好地提取了獼猴桃果園信息;王娜[14]等基于隨機(jī)森林算法和單變量特征選擇方法,利用多源信息綜合的分類方案,有效提取了實(shí)驗(yàn)區(qū)的主要農(nóng)作物;GAO T[15]等基于隨機(jī)森林算法,采用多時相光譜信息、多尺度紋理信息和地形因子對河北塞罕壩林區(qū)的樹種進(jìn)行了分類研究;WANG B[16]等基于多時相Landsat8 OLI影像和隨機(jī)森林算法提取了茶園信息,利用光譜信息、紋理信息、植被指數(shù)特征構(gòu)建了多層次的特征集,結(jié)果表明采用特征優(yōu)選法構(gòu)建的多季節(jié)優(yōu)選特征集具有最高的提取精度。

        由上述研究可以看出,隨機(jī)森林算法具有提取精度高、魯棒性強(qiáng)等優(yōu)點(diǎn),但目前該算法在臍橙果園種植信息提取方面的研究仍相對較少。本文充分利用隨機(jī)森林算法的優(yōu)勢,選取重慶奉節(jié)地區(qū)質(zhì)量較好的Landsat8 OLI影像數(shù)據(jù),綜合光譜特征、植被指數(shù)特征、紋理特征和地形因子構(gòu)建初始特征集和優(yōu)選特征集,探索能有效識別臍橙果園的分類特征與模型,以期為基于遙感技術(shù)快速、準(zhǔn)確獲取臍橙果園種植信息提供依據(jù)。

        1 數(shù)據(jù)來源與研究方法

        1.1 研究區(qū)概況與數(shù)據(jù)來源

        奉節(jié)縣位于重慶市東部、三峽庫區(qū)腹心地區(qū)(圖1),地理坐標(biāo)為109e1′17″~109e45′58″E、30e29′19″~31e22′33″N。全縣總面積為4 087 km2,地勢南北高、中部低,海拔為135~2 123 m;屬中亞熱帶濕潤季風(fēng)氣候,年平均氣溫為18℃,年降水量為769 mm,年平均無霜期為364 d,年平均濕度為67%,具有開展臍橙種植的優(yōu)越地貌與氣候條件。

        圖1 研究區(qū)遙感影像圖

        本文選取Landsat8 OLI多光譜影像作為主要數(shù)據(jù)源。Landsat8為美國航天局陸地衛(wèi)星計劃的第八顆衛(wèi)星,攜有OLI陸地成像儀和TIRS熱紅外傳感器,其中OLI陸地成像儀包括9個光譜波段,空間分辨率為 30 m。本文中的Landsat8 OLI產(chǎn)品數(shù)據(jù)下載于地理空間數(shù)據(jù)云,數(shù)據(jù)時相為2017-02-05、2017-11-04和2017-12-22;其他數(shù)據(jù)包括30 m分辨率DEM數(shù)據(jù)、同年土地利用數(shù)據(jù)、GF-1號衛(wèi)星影像數(shù)據(jù)和2017年實(shí)地調(diào)查數(shù)據(jù)。 本文主要利用EnMAP-BOX和ENVI軟件對數(shù)據(jù)進(jìn)行預(yù)處理。首先根據(jù)矢量數(shù)據(jù)對初始影像進(jìn)行裁剪;再利用ENVI 5.3中的輻射校正模塊對影像進(jìn)行輻射校正,校正時需注意OLI陸地成像儀對應(yīng)的增益和偏移參數(shù);最后進(jìn)行快速大氣校正。

        1.2 研究方法

        本文以隨機(jī)森林算法為分類模型,基于光譜特征、紋理特征、植被指數(shù)特征、地形因子及其組合,對奉節(jié)縣臍橙果園種植的空間分布信息進(jìn)行提取??傮w技術(shù)流程如圖2所示。

        圖2 總體技術(shù)流程圖

        1.2.1 果園特征提取

        1)紋理特征。影像判讀場景下,紋理特征可反映影像的均勻、細(xì)致、粗糙等情況。遙感影像可生成許多紋理指標(biāo),本文采用灰度共生矩陣計算相關(guān)紋理特征。其數(shù)學(xué)模型為:

        式中,Z為該集合中元素的數(shù)目;f(x1,y1)=h表示影像(x1,y1)處像元的灰度值為h;d為兩個像元之間的距離,取值范圍為{1,2,3,4};θ為兩個像元之間的方向角,取值范圍為{0e 45e 90e 135e}。

        本文選取均值、方差、協(xié)同性、對比度、相異性、熵、二階矩和相關(guān)性8個紋理特征對影像進(jìn)行定量分析。由式(1)可知,各紋理統(tǒng)計量均為關(guān)于方向的函數(shù),為消除角度帶來的影響,本文采用先疊加4個方向的統(tǒng)計量再求平均值的方法。由于多波段紋理分析會產(chǎn)生一定的信息交叉問題,因此本文在對原始影像進(jìn)行主成分分析后選取第一主成分波段來獲取上述 8個紋理特征[17-18]。

        2)植被指數(shù)特征。植被指數(shù)是從多光譜數(shù)據(jù)中提取的、能有效度量地表植被狀況的數(shù)值,與植被覆蓋度、生物量均有較好的相關(guān)性[19]。本文采用歸一化植被指數(shù)(NDVI)、土壤調(diào)節(jié)植被指數(shù)(SAVI)、增強(qiáng)型植被指數(shù)(EVI)和比值植被指數(shù)(RVI)進(jìn)行分析研究。

        式中,NIR為近紅外波段反射值;R為紅光波段反射值。

        式中,L為樹冠調(diào)整系數(shù),本文設(shè)置L=0.5,該值能最大限度地減少土壤亮度的影響,且無需對不同土壤類型進(jìn)行重新設(shè)置。

        式中,B為藍(lán)光波段反射值;E為增強(qiáng)因子;M1、M2分別為氣溶膠阻抗系數(shù)。L、M1、M2和E的經(jīng)驗(yàn)值分別為1、6、7.5和2.5。

        3)地形因子。地形作為重要的環(huán)境因子,控制著水、光、土壤養(yǎng)分等資源的再分配,進(jìn)而影響植被的分布。本文利用ArcGIS 10.4軟件從研究區(qū)的DEM數(shù)據(jù)中提取坡度和坡向信息,將高程、坡度、坡向因子引入到研究區(qū)臍橙果園信息的提取研究中。

        所有特征提取參數(shù)如表1所示。

        表1 特征參數(shù)統(tǒng)計

        1.2.2 隨機(jī)森林算法

        隨機(jī)森林算法最早由Breiman L[20]提出,是一種基于分類與回歸決策樹(CART)的新型機(jī)器學(xué)習(xí)算法,可分析多達(dá)幾千個輸入特征的重要性,是目前應(yīng)用最廣泛的機(jī)器學(xué)習(xí)算法之一[21-22]。其主要思想是集成眾多決策樹的結(jié)果對分類任務(wù)進(jìn)行統(tǒng)籌分析,具體實(shí)現(xiàn)過程為:

        1)構(gòu)建訓(xùn)練樣本集。采用隨機(jī)且有放回的方式從原始樣本集中抽取部分樣本構(gòu)成訓(xùn)練樣本集(Bootstrap法),重復(fù)N次即可得到N個訓(xùn)練樣本集。

        2)建立N棵CART決策樹。以訓(xùn)練樣本集中的樣本為基礎(chǔ),首先從全部的輸入特征M中隨機(jī)選取m個特征(節(jié)點(diǎn)隨機(jī)分裂法),然后根據(jù)方差不純度指標(biāo)對m個特征進(jìn)行建樹。其計算公式為:

        式中,wi為第i類的屬性;wj為節(jié)點(diǎn)N處屬wj樣本數(shù)占總樣本數(shù)的頻度;i為方差不純度。

        預(yù)設(shè)一個方差不純度下降值的閾值,若分支后方差不純度的下降值小于該閾值,則停止分支。至此,N棵決策樹構(gòu)建完成。

        3)統(tǒng)籌決策樹結(jié)果。將構(gòu)建好的所有決策樹組成隨機(jī)森林,利用隨機(jī)森林分類器進(jìn)行分類,最終通過投票的方式來確定分類結(jié)果。

        在本文中,隨機(jī)森林算法不僅能對Landsat8 OLI影像進(jìn)行分類,而且能對輸入特征進(jìn)行重要性排序。在Bootstrap抽樣過程中,原始數(shù)據(jù)中約有1/3未被抽取到,這部分?jǐn)?shù)據(jù)稱為袋外數(shù)據(jù)(OOB)。通過OOB數(shù)據(jù)產(chǎn)生的OOB誤差可計算得到各輸入特征的重要性,從而進(jìn)行特征選擇[23]。特征重要性評估模型的表達(dá)式為:

        式中,F(xiàn)E為特征重要性;M為特征總數(shù);N為分類決 策樹總數(shù);為對特征MA加入噪聲前第t棵分類決策樹的OOB誤差值;為對特征MA加入噪聲后 第t棵分類決策樹的OOB誤差值。若給特征MA加入噪聲后,OOB誤差顯著提高導(dǎo)致精度損失量較大,則說明該輸入特征的重要性程度較高。

        隨機(jī)森林算法中的兩個主要參數(shù)為分類決策樹數(shù)量N和建樹中隨機(jī)選取的特征數(shù)m。對于m值,本文選取總特征數(shù)的算術(shù)平方根作為實(shí)驗(yàn)值;對于N值, 其值越高其分類準(zhǔn)確率不僅達(dá)不到最高,而且運(yùn)算時間和內(nèi)存成本也會較高,本文經(jīng)多次試驗(yàn)發(fā)現(xiàn),N值設(shè)置為1 000時,各方案的OOB誤差趨于穩(wěn)定。

        1.2.3 精度評價

        混淆矩陣也稱誤差矩陣,主要用于比較分類結(jié)果與實(shí)際類別值,并把分類精度顯示在矩陣?yán)铩1疚牟捎眠x取隨機(jī)參考點(diǎn)的方法,將研究區(qū)分類結(jié)果與同期GF-2號 衛(wèi)星數(shù)據(jù)進(jìn)行對照,并獲取了研究區(qū)分類結(jié)果的混淆矩陣;再通過混淆矩陣計算得到總體精度、Kappa系數(shù)、錯分誤差和漏分誤差,進(jìn)而對各方案進(jìn)行評價。

        2 研究結(jié)果與分析

        2.1 實(shí)驗(yàn)方案設(shè)置

        為了取得最佳的提取效果,本文設(shè)計了5組實(shí)驗(yàn)方案進(jìn)行研究,如表2所示。設(shè)置這些實(shí)驗(yàn)方案主要是考慮到以下兩點(diǎn):①研究各特征對臍橙果園空間分布信息提取的重要性程度;②尋找提高臍橙果園空間分布信息提取精度的最佳方法。

        表2 實(shí)驗(yàn)方案信息表

        2.2 特征優(yōu)選分析

        本文利用隨機(jī)森林算法計算方案D中63個特征變量的重要性得分,各特征得分如圖3所示,特征前的數(shù)字02、11、12分別表示2月、11月、12月的時相;B1~B6分別表示Landsat8 OLI影像的藍(lán)光、綠光、紅光、近紅外、短波紅外第一波段、短波紅外第二波段;PC1、PC2分別表示影像的第一主成分和第二主成分波段。

        圖3 各特征重要性

        由圖3可知,不同特征的重要性差異較大,最高的11-B1特征重要性高達(dá)13.94,最低的12-VAR特征重要性低至0.39。本文選擇重要性排在前1/4的特征構(gòu)成方案E優(yōu)選特征集[16]。方案E的13個特征變量如表3所示,其中光譜特征包括11月藍(lán)光波段、11月綠光波段、11月紅光波段、12月藍(lán)光波段、12月第二 主成分波段和12月短波紅外第二波段,植被指數(shù)特征包括11月NDVI、11月RVI、12月NDVI、12月RVI、12月EVI和12月SAVI,地形因子為DEM因子,說明光譜特征和植被指數(shù)特征的作用較顯著,紋理特征和地形因子貢獻(xiàn)不大。將特征類型按季節(jié)來統(tǒng)計發(fā)現(xiàn),秋季有5個,冬季有7個,春季沒有,說明秋、冬季時相對于臍橙果園信息提取較適合。

        表3 優(yōu)選特征分布表

        2.3 臍橙提取結(jié)果與精度分析

        2.3.1 臍橙提取結(jié)果

        所有實(shí)驗(yàn)方案的提取結(jié)果如圖4所示。由于本文主要的提取對象為臍橙,且為更好地展示臍橙種植在江河流域的特點(diǎn),因此圖中只顯示臍橙和水體對象,參與分類的耕地、建筑用地、林地和裸地統(tǒng)一歸為其他地物。通過目視解譯方法對比GF-1號衛(wèi)星影像發(fā)現(xiàn),方案A和方案C 中不同類別地物之間存在較多錯分的情況,如影像右下的流域區(qū)域,林地區(qū)域被分成了臍橙。從目視解譯對比效果來看,基于光譜特征和植被指數(shù)特征綜合的方案B以及基于優(yōu)選特征組合的方案E的提取效果最佳,且后者的提取結(jié)果優(yōu)于其他實(shí)驗(yàn)方案。

        圖4 各方案的臍橙提取結(jié)果圖

        2.3.2 精度評價分析

        為定量評價各方案臍橙果園空間分布信息的提取精度,本文利用驗(yàn)證數(shù)據(jù)計算混淆矩陣,選取總體精度、Kappa系數(shù)、錯分誤差和漏分誤差作為評價指標(biāo),對比分析各方案的提取結(jié)果,評價方案的優(yōu)劣。具體結(jié)果如表4所示,可以看出,僅包含多時相光譜特征的方案A的總體精度為85.27%,Kappa系數(shù)為0.83;加入植被指數(shù)特征的方案B的總體精度和Kappa系數(shù)均略有提升,分別為86.71%和0.84;但反觀加入紋理特征的方案C,其總體精度和Kappa系數(shù)則有小幅下降,分別為83.04%和0.81,表明植被指數(shù)特征的加入將提高臍橙信息提取的精度,但紋理特征不一定能提高分類精度,反而會損失一些分類精度;涵蓋所有特征的方案D的總體精度和Kappa系數(shù)均大幅提高,但低于方案E;隨機(jī)森林特征優(yōu)選后的方案E的總體精度和Kappa系數(shù)達(dá)到最高,分別為90.71%和0.89。

        表4 不同實(shí)驗(yàn)方案的精度對比

        另外,對于錯分誤差,除紋理特征外,各類特征的加入均有效改善了提取精度,表明植被指數(shù)特征和地形因子有效減少了臍橙錯分的概率。在漏分誤差方面,紋理特征同樣對臍橙提取精度的改善不明顯,漏分現(xiàn)象較方案A未有效減輕。由錯分和漏分誤差可知,優(yōu)選特征組合具有顯著的提升效果。

        綜上所述,光譜特征中單獨(dú)引入植被指數(shù)特征時,總體精度改善最顯著,而單獨(dú)引入紋理特征時總體精度略有下降,說明植被指數(shù)特征在提取中具有顯著作用;優(yōu)選特征組合在精度上的改善最顯著,其提取精度高于其他兩兩類型特征組合的原因在于,它是各類型特征優(yōu)選子集的組合,具備多源信息的優(yōu)勢,同時其提取精度亦高于所有特征綜合的方案,主要原因?yàn)楹笳咛卣鲾?shù)量多、數(shù)據(jù)間相關(guān)性強(qiáng),而優(yōu)選特征組合只保留了貢獻(xiàn)大的特征,降低了數(shù)據(jù)維度,減少了數(shù)據(jù)間的相關(guān)性。

        3 結(jié) 語

        針對目前臍橙果園遙感提取中存在的提取精度低的問題,本文綜合多時相光譜信息、植被指數(shù)特征、紋理特征和地形因子,利用隨機(jī)森林算法有效實(shí)現(xiàn)了臍橙果園信息的提取,克服了經(jīng)濟(jì)作物遙感提取特征較為單一的不足。利用隨機(jī)森林重要性排序算法獲取了輸入特征的重要性,有效構(gòu)建了優(yōu)選特征組合,不僅有效降低了數(shù)據(jù)維度,還改善了提取精度。由此可見,隨機(jī)森林算法在保證精度的同時還能提高運(yùn)算效率,是一種可行且高效的遙感提取算法。本文也為后續(xù)的經(jīng)濟(jì)作物擴(kuò)張以及生態(tài)環(huán)境評價系列研究提供了有效的數(shù)據(jù)參考。本文的不足之處是實(shí)驗(yàn)中隨機(jī)森林算法的決策樹棵數(shù)、特征變量數(shù)和優(yōu)選特征數(shù)均采用經(jīng)驗(yàn)值,后續(xù)研究可結(jié)合遺傳算法等參數(shù)尋優(yōu)算法來選取最優(yōu)參數(shù),以期進(jìn)一步提高提取效率;實(shí)驗(yàn)中只應(yīng)用了上述3類特征,后續(xù)研究將添加地理統(tǒng)計紋理或小波紋理等特征,以繼續(xù)尋找有助于臍橙果園信息提取的特征以及特征組合。

        猜你喜歡
        分類特征
        抓住特征巧觀察
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        新型冠狀病毒及其流行病學(xué)特征認(rèn)識
        如何表達(dá)“特征”
        不忠誠的四個特征
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        抓住特征巧觀察
        久草视频在线手机免费看 | 亚洲传媒av一区二区三区| 亚洲AV秘 无码一区二区三区| 日韩性感av一区二区三区| 亚洲久悠悠色悠在线播放| 少妇人妻大乳在线视频不卡 | 岳丰满多毛的大隂户| 最近中文字幕免费完整版| av无码精品一区二区三区四区| 国产一区二区a毛片色欲| 亚洲大片一区二区三区四区| 久久精品国产亚洲av蜜点| 亚洲人成网站色www| 国产高清视频91| 亚洲中文字幕永久网站| 亚洲亚色中文字幕剧情| 久激情内射婷内射蜜桃| 日韩精品无码一区二区中文字幕 | 成人免费无码a毛片| 国产色第一区不卡高清| 国产区精品一区二区不卡中文| 99久久精品日本一区二区免费| 国产真实露脸4p视频| 国内精品嫩模av私拍在线观看| 午夜视频在线观看视频在线播放| 国产精品久久久久精品一区二区 | 日本精品一区二区三区二人码 | 国产精品嫩草影院AV| 久久伊人精品只有这里有| 国产成年人毛片在线99| 影音先锋男人站| 99这里只有精品| 精品日产一区2区三区| 女色av少妇一区二区三区| 男女爱爱好爽视频免费看| 日韩在线无| 国产精品久久久久亚洲| 亚洲国产精品自拍成人| 天天做天天爱夜夜爽女人爽| 亚洲va中文字幕无码久久不卡| 亚洲免费av电影一区二区三区|