劉 舒,朱 航
·農(nóng)業(yè)航空工程·
基于超高空間分辯率無(wú)人機(jī)影像的面向?qū)ο笸恋乩梅诸?lèi)方法
劉 舒1,朱 航2※
(1. 吉林建筑大學(xué)測(cè)繪與勘查工程學(xué)院,長(zhǎng)春 130118; 2. 吉林大學(xué)機(jī)械與航空航天工程學(xué)院,長(zhǎng)春 130022)
為明確基于無(wú)人機(jī)超高空間分辨率影像的土地利用分類(lèi)方法,尤其是有效特征和算法的選擇,該研究獲取吉林省德惠市一農(nóng)耕區(qū)超高分無(wú)人機(jī)影像,獲取區(qū)域正射影像圖和數(shù)字表面模型,計(jì)算地形指標(biāo),采用面向?qū)ο蠓椒ㄟM(jìn)行土地利用分類(lèi)研究。首先,采用隨機(jī)森林算法,以光譜特征為基礎(chǔ),依次引入指數(shù)、形態(tài)、地形、紋理特征,建立5種特征選擇方案,分析各類(lèi)特征對(duì)分類(lèi)效果的影響。其次,以Boruta特征選擇算法獲取的優(yōu)化特征集為基礎(chǔ),采用隨機(jī)森林算法、樸素貝葉斯算法、邏輯回歸算法和支持向量機(jī)算法分類(lèi),分析不同算法的分類(lèi)效果。結(jié)果表明:采用5種特征選擇方案分類(lèi),引入形態(tài)特征時(shí)總體精度降低,引入其他特征時(shí)總體精度逐漸提高。5種特征共同參與的分類(lèi)效果最佳,總體精度為98.04%,Kappa系數(shù)為0.980。錯(cuò)分主要發(fā)生在裸地和宅基地,漏分主要發(fā)生在草地、裸地、水渠和道路。錯(cuò)分和漏分主要是因?yàn)檫@幾種類(lèi)型對(duì)象具有相似的光譜、形態(tài)、紋理特征或相似的分布位置。采用優(yōu)化特征集分類(lèi)時(shí),相比其他算法,隨機(jī)森林算法更擅長(zhǎng)處理高維特征集,獲得最高的總體精度98.19%,最低的錯(cuò)分和漏分誤差,分類(lèi)效果最佳。借助無(wú)人機(jī)超高空間分辨率影像提取地形信息、形態(tài)信息,可以有效輔助土地利用分類(lèi),并能提高傳統(tǒng)分類(lèi)方法精度。
遙感;土地利用;無(wú)人機(jī)影像;面向?qū)ο?;特征選擇;隨機(jī)森林
實(shí)時(shí)可靠的土地利用信息,是土地利用變化監(jiān)測(cè)的基礎(chǔ)[1]。目前常使用衛(wèi)星獲取的多光譜數(shù)據(jù)提取土地利用信息[2-3]。由于受數(shù)據(jù)空間分辨率、獲取條件和成本的限制,常用的衛(wèi)星數(shù)據(jù)無(wú)法識(shí)別精細(xì)尺度的地物細(xì)節(jié),且數(shù)據(jù)獲取時(shí)間受衛(wèi)星重訪周期制約。近年來(lái)小型無(wú)人機(jī)迅速發(fā)展,具有操作簡(jiǎn)單,使用靈活,空間分辨率高,且在云下操作等特點(diǎn),彌補(bǔ)了衛(wèi)星遙感影像的應(yīng)用限制[4]。此外,無(wú)人機(jī)可根據(jù)需要加載多種傳感器獲取數(shù)據(jù),也可以一定航高和重疊度,按照規(guī)定航線獲取影像,建立數(shù)字表面模型(digital surface model, DSM),擴(kuò)展可利用信息[5-6]。目前無(wú)人機(jī)遙感技術(shù)已被廣泛用于土地利用分類(lèi)[4-8]、農(nóng)情監(jiān)測(cè)[9-10]、自然災(zāi)害分析[11-12]、專(zhuān)題信息提取與專(zhuān)題圖制作[6]等領(lǐng)域中。當(dāng)采用無(wú)人機(jī)影像進(jìn)行土地利用分類(lèi)時(shí),影像高空間分辨率在降低混合像元帶來(lái)影響的同時(shí),也增大了計(jì)算機(jī)的數(shù)據(jù)處理量。過(guò)高的空間分辨率加強(qiáng)了地物細(xì)節(jié),增大同類(lèi)地物間的細(xì)節(jié)差異以及不同地物間的相似程度,降低分類(lèi)精度[13]。若基于無(wú)人機(jī)常規(guī)傳感器獲取可見(jiàn)光波段的影像進(jìn)行分類(lèi),較低的光譜分辨率也會(huì)影響分類(lèi)的效果。
常用的分類(lèi)方法包括面向像素方法和面向?qū)ο蠓椒?。面向?qū)ο蠓诸?lèi)以分割后的對(duì)象為基本單元,平滑了影像噪聲和不必要的細(xì)節(jié);減少參與運(yùn)算的數(shù)據(jù)量;整合不同類(lèi)型數(shù)據(jù);引入對(duì)象的形態(tài)、上下文等特征,進(jìn)一步挖掘分類(lèi)可用信息,提高分類(lèi)精度和結(jié)果可靠性[2]。然而,面向?qū)ο蟮姆椒m彌補(bǔ)了基于無(wú)人機(jī)可見(jiàn)光影像分類(lèi)的不足,但在結(jié)合多種數(shù)據(jù)的同時(shí),也增大了特征空間的維度[1],其中的次要特征可能起到噪聲作用,降低分類(lèi)精度[14]。隨機(jī)森林是一種集成分類(lèi)算法,因其強(qiáng)大的數(shù)據(jù)整合與靈活處理能力,近年來(lái)被應(yīng)用在醫(yī)學(xué)、生物學(xué)、管理學(xué)、遙感等領(lǐng)域,并取得了穩(wěn)定可信的研究成果[15-16]。目前,該算法已被用于基于多光譜、雷達(dá)和無(wú)人機(jī)影像的土地利用類(lèi)型提取中[8,17-18]。
無(wú)人機(jī)影像與傳統(tǒng)遙感影像相比具有一定的相似性和特殊性。傳統(tǒng)方法的適用性、新方法的可行性以及分類(lèi)特征的作用仍然被廣泛討論[19]。劉凱等[20]以紅樹(shù)林為研究對(duì)象,討論了不同類(lèi)型無(wú)人機(jī)數(shù)據(jù)的分類(lèi)效果,劉斌[21]討論了不同影像分辨率對(duì)分類(lèi)結(jié)果的影響,耿仁方等[7]討論了以不同影像處理軟件獲得DSM和數(shù)字正射影像圖(digital orthophoto map, DOM)對(duì)分類(lèi)的影響。目前廣泛采用光譜、指數(shù)、紋理和上下文特征,僅少數(shù)研究用到反映地形的地物表面特征。此外,單一類(lèi)型特征,尤其是由超高分無(wú)人機(jī)影像提取的特征,對(duì)實(shí)際分類(lèi)效果的影響尚不明確,采用不同算法對(duì)區(qū)域分類(lèi)結(jié)果的影響也需要進(jìn)一步討論。本研究獲取吉林省德惠市一農(nóng)耕區(qū)的無(wú)人機(jī)超高分可見(jiàn)光影像,采用面向?qū)ο蟮碾S機(jī)森林算法,進(jìn)行土地利用分類(lèi),分析不同類(lèi)型特征對(duì)分類(lèi)結(jié)果的影響,并借助Boruta特征選擇算法獲取優(yōu)化特征集,分別采用隨機(jī)森林、樸素貝葉斯、邏輯回歸和支持向量機(jī)算法分類(lèi),分析不同算法的分類(lèi)效果,評(píng)估分類(lèi)方法的實(shí)用性。
研究區(qū)位于吉林省德惠市的農(nóng)耕區(qū)。區(qū)域地理位置:44°34′N(xiāo),126°17′E,屬于溫帶大陸性氣候,光照充足,降水量較少。區(qū)域內(nèi)作物以一年一熟的水稻、玉米為主。本研究影像拍攝于9月下旬,此時(shí)水稻成熟,部分已被收割并堆放在田間,田塊內(nèi)可見(jiàn)割茬殘留。玉米田尚未大規(guī)模收割[22]。田間分布有水渠,用于排水和灌溉。區(qū)內(nèi)還分布有道路、草地、農(nóng)村宅基地以及鮮有植被生長(zhǎng)的裸地。道路兩側(cè)的綠化帶以及位于房屋周?chē)臈顦?shù)為林地。依據(jù)2017年發(fā)布并實(shí)施的土地利用現(xiàn)狀分類(lèi)標(biāo)準(zhǔn),將研究區(qū)土地利用類(lèi)型劃分為:水田、旱地、裸地、道路、水渠、宅基地、林地和草地[23]。
于2018年9月23日下午采用大疆精靈4搭載非量測(cè)相機(jī)分10條航帶進(jìn)行拍攝,設(shè)定航高為60 m,航向重疊度為70%,旁向重疊度為65%,共獲取研究區(qū)影像104張。影像傳感器為CMOS,可獲取紅光、綠光和藍(lán)光3個(gè)通道的像片,像片尺寸為4 000′3 000像素,空間分辨率約為0.04 m,為超高空間分辨率影像[7,19]。航片借助攝影測(cè)量軟件進(jìn)行匹配,并生成DSM和DOM,如圖1所示。
圖1 研究區(qū)數(shù)字表面模型(DSM)和正射影像圖(DOM)
借助ArcGIS軟件生成區(qū)域表面坡度、坡面、山體陰影圖等。DOM包括紅(),綠(),藍(lán)()3個(gè)波段,在ENVI5.1中以DOM為基礎(chǔ)計(jì)算5種僅基于RGB波段的植被指數(shù),生成指數(shù)波段,并將以上數(shù)據(jù)合并為分類(lèi)基礎(chǔ)影像。植被指數(shù)包括紅綠比值指數(shù)(red green ratio index, RGRI),歸一化綠藍(lán)指數(shù)(normalized green-blue difference index, NGBDI),歸一化紅綠指數(shù)(normalized green-red difference index, NGRDI),過(guò)綠指數(shù)(excess green index, EXG)和差異植被指數(shù)(visible-band difference vegetation index, VDVI),計(jì)算公式如表1所示[24]。
表1 指數(shù)特征計(jì)算公式[24]
注:為DOM紅波段,為DOM綠波段,為DOM藍(lán)波段。
Note:is the red band of DOM,is the green band of DOM andis the blue band of DOM.
隨機(jī)森林算法(random forest, RF)實(shí)質(zhì)是決策樹(shù)的組合。本研究應(yīng)用R語(yǔ)言軟件Random Forest語(yǔ)言包實(shí)現(xiàn)分類(lèi)過(guò)程。從樣本集有放回地抽取約2/3樣本構(gòu)成訓(xùn)練集,再?gòu)钠浒娜刻卣髦须S機(jī)抽取有限個(gè)樣本建立決策樹(shù),并利用未被抽取的樣本估計(jì)分類(lèi)內(nèi)部誤差。重復(fù)此過(guò)程,建立多棵決策樹(shù),構(gòu)成隨機(jī)森林模型。在為新數(shù)據(jù)分類(lèi)時(shí),所有決策樹(shù)獨(dú)立預(yù)測(cè)結(jié)果,通過(guò)投票方式?jīng)Q定目標(biāo)的最可能類(lèi)別,并得出袋外誤差(out-of-bag error, OOB誤差),用以評(píng)價(jià)分類(lèi)結(jié)果精度和分類(lèi)特征重要性[2-3,17]。袋外誤差越小,模型分類(lèi)效果越好。
本研究采用Ecognition軟件多尺度分割模塊進(jìn)行分割,分割前需設(shè)置尺度參數(shù),各圖層的權(quán)重,形狀異質(zhì)性權(quán)重(Shape)和緊致度異質(zhì)性權(quán)重(Compactness)。本研究將所有圖層權(quán)重設(shè)為1,并應(yīng)用ESP(estimation of scale parameter)插件通過(guò)試驗(yàn)確定其他參數(shù)的取值。ESP插件由下至上迭代分割,以對(duì)象局部方差(local variance, LV)估計(jì)影像對(duì)象內(nèi)部異質(zhì)性,根據(jù)局部方差變化率(rate of change of LV, ROC)確定分割尺度[25-26]。迭代時(shí)首先將形狀異質(zhì)性權(quán)重(shape)、緊致度異質(zhì)性權(quán)重(compactness)以0.1為步長(zhǎng),取遍0.1~0.9的所有值進(jìn)行多次分割試驗(yàn),確定理想的shape和compactness取值分別為0.8和0.6,此時(shí)獲得的ROC曲線和LV曲線如圖2a所示。
圖2a中LV曲線有多個(gè)峰值,即可獲得多個(gè)最佳尺度取值。為保證對(duì)象類(lèi)型的純度,取第一個(gè)峰值對(duì)應(yīng)的最佳分割尺度45為本研究分割尺度,局部影像分割結(jié)果如圖2b所示。對(duì)于農(nóng)田部分雖然分割較細(xì),但邊界與地物實(shí)際邊界位置相符,分割結(jié)果可靠。
共提取對(duì)象的100個(gè)特征信息,包括以下5大類(lèi)(表2)。
1)光譜特征(Spec_Feat):DOM中、、波段的均值(Mean)、標(biāo)準(zhǔn)差(standard deviation, SD)、以及波段最大差異(Max_diff)和總體亮度值(Brightness)特征,共8個(gè)[15]。
2)指數(shù)特征(VI_Feat):分類(lèi)基礎(chǔ)影像5種指數(shù)波段的均值和標(biāo)準(zhǔn)差,共10個(gè)。
3)地形特征(DTM_Feat):DSM中的表面高程特征,以及由此獲取的表面坡度(Slope)、表面坡向(Aspect)和山體陰影(Hillshade)特征的均值和標(biāo)準(zhǔn)差,共8個(gè)。
4)紋理特征(GLCM_Feat):DOM中R、G和B波段和DSM、Slope、Aspect和Hillshade波段各對(duì)象全方位灰度共生矩陣(GLCM)的均值、標(biāo)準(zhǔn)差、熵(Ent)、同質(zhì)度(Homo)、對(duì)比度(Const)、非相似性(Dis)、角二階矩(Ang)和相關(guān)性(Corr)特征,共56個(gè)。紋理特征中以Mea表示均值,以StD表示標(biāo)準(zhǔn)差。
5)形態(tài)特征(SHP_Feat):對(duì)象形狀和范圍特征共18個(gè)。
圖2 最佳分割尺度及影像分割結(jié)果
表2 提取特征列表
隨機(jī)森林分類(lèi)效果受樣本數(shù)量及其分布的制約[14],參考野外照片,依據(jù)地物實(shí)際分布和概略面積比例,以50為各類(lèi)別最小樣本量,按照表3選取8類(lèi)地物的樣本,將其中60%作為訓(xùn)練樣本建立分類(lèi)模型,剩余40%為測(cè)試樣本,計(jì)算總體精度、Kappa系數(shù)、錯(cuò)分誤差和漏分誤差等指標(biāo),評(píng)估模型分類(lèi)精度[27]。
表3 各土地利用類(lèi)型樣本數(shù)量
調(diào)用Random Forest語(yǔ)句時(shí)需要設(shè)置2個(gè)重要參數(shù),一個(gè)為森林中決策樹(shù)棵數(shù);另一個(gè)為抽取特征數(shù)。選用不同的樣本和特征類(lèi)型,最佳的參數(shù)取值不同,需通過(guò)迭代試驗(yàn)來(lái)確定。首先固定生成決策樹(shù)數(shù)目為3000,抽取特征數(shù)取遍1和最大值之間的所有整數(shù)值分別建模,計(jì)算每個(gè)模型的OOB誤差,OOB取最小值時(shí)的值(0)即為最佳參與建模特征數(shù)。再令=0,令取遍1到3000的所有整數(shù)值,比較模型的OOB誤差,選擇合適的取值。
為研究不同特征對(duì)分類(lèi)效果的影響,本研究首先設(shè)定不同的特征選擇方案并篩選子特征集,進(jìn)行多次分類(lèi)對(duì)比試驗(yàn)。方案1僅選擇光譜特征(Spec),方案2在此基礎(chǔ)上添加指數(shù)特征(Spec+VI),方案3再引入形態(tài)特征(Spec+VI+SHP),方案4進(jìn)一步引入紋理特征(Spec+VI+SHP+DTM),方案5采用全部特征類(lèi)型(Spec+VI+SHP+DTM+GLCM)。對(duì)于所有的特征選擇方案做和取值的試驗(yàn),確定參數(shù)取值。各取值對(duì)應(yīng)的OOB誤差如圖3a和圖3b所示。
注:圖中方案1~方案5依次表示采用子特征集Spec、Spec+VI、Spec+VI+SHP、Spec+VI+SHP+DTM、Spec+VI+SHP+DTM+GLCM進(jìn)行分類(lèi)試驗(yàn)。
圖3a表明,隨著抽取特征個(gè)數(shù)增多,各方案的OOB誤差取值呈先減小后增大的趨勢(shì),對(duì)特征選擇方案1~方案5,OOB取最小時(shí)對(duì)應(yīng)的參數(shù)值依次為2、2、8、10和24。當(dāng)參數(shù)大于2 000時(shí),圖3b中各方案OOB誤差取值趨于穩(wěn)定,因此將各方案參數(shù)取值統(tǒng)一設(shè)為2 000。增加選取特征類(lèi)別時(shí),除采用方案3外,各方案的OOB誤差間大體呈減小趨勢(shì)。采用特征選擇方案3時(shí),對(duì)于和的絕大多數(shù)取值,模型分類(lèi)精度低于采用方案2的結(jié)果??梢?jiàn)部分形態(tài)特征對(duì)分類(lèi)起到干擾作用。
采用RF內(nèi)置的Boruta特征選擇算法,按照特征的平均重要程度(MeanImp)指標(biāo)判斷其在分類(lèi)中的有效性,構(gòu)建優(yōu)化特征集(Spec+VI+SHP+DTM+GLCM2)。以?xún)?yōu)化特征集為基礎(chǔ),分別采用基于最優(yōu)參數(shù)值的隨機(jī)森林算法(RF)、樸素貝葉斯算法(naive Bayesian, NB)、邏輯回歸算法(logistic regression, LR)和支持向量機(jī)算法(support vector machine, SVM)分別進(jìn)行分類(lèi),分析不同算法對(duì)分類(lèi)結(jié)果的影響。
基于最優(yōu)參數(shù)和樣本數(shù)據(jù)分類(lèi)的總體精度和Kappa系數(shù)如表4所示。
表4 不同方案分類(lèi)精度對(duì)比
在采用隨機(jī)森林算法評(píng)估不同特征選擇方案時(shí),方案1~方案5的總體分類(lèi)精度分別為93.72%、97.35%、96.93%、97.77%和98.04%,Kappa系數(shù)值分別為0.937、0.973、0.969、0.978和0.980。所有方案分類(lèi)結(jié)果的總體精度都達(dá)到90%以上,表明面向?qū)ο蟮碾S機(jī)森林算法是一種有效的分類(lèi)方法,且分類(lèi)結(jié)果具有較高精度。
將不同的特征依次引入分類(lèi)特征集時(shí),除引入SHP時(shí)外,各分類(lèi)結(jié)果總體精度和Kappa系數(shù)呈逐漸增大趨勢(shì),采用方案5時(shí)分類(lèi)結(jié)果最佳。表明引入多類(lèi)特征有利于提高分類(lèi)精度。為明確形態(tài)特征的作用,補(bǔ)充進(jìn)行2次試驗(yàn),分別采用跳過(guò)形態(tài)特征直接引入地形特征的方案6(Spec+VI+DTM),以及在此基礎(chǔ)上引入紋理特征的方案7(Spec+VI+DTM+GLCM)進(jìn)行分類(lèi)。這2種方案的總體精度分別高于與之對(duì)應(yīng)的方案3和方案4,但仍低于方案5,表明分類(lèi)過(guò)程應(yīng)引入形態(tài)特征,不過(guò)部分形態(tài)特征相當(dāng)于噪聲數(shù)據(jù),降低分類(lèi)結(jié)果精度。
在方案5的基礎(chǔ)上,采用Boruta算法進(jìn)行特征選擇,共72個(gè)特征通過(guò)篩選,包括全部的光譜特征、指數(shù)特征,7個(gè)地形特征,4個(gè)形態(tài)特征以及43個(gè)紋理特征。根據(jù)平均重要程度指標(biāo),對(duì)分類(lèi)起重要作用的特征依次為光譜特征、指數(shù)特征、地形特征、紋理特征和形態(tài)特征。
以?xún)?yōu)化特征集為基礎(chǔ)的分類(lèi)試驗(yàn)中,采用隨機(jī)森林算法的分類(lèi)結(jié)果最佳,總體精度為98.19%,Kappa系數(shù)為0.982,優(yōu)于其他算法的結(jié)果,也優(yōu)于方案5的分類(lèi)結(jié)果。采用邏輯回歸算法、支持向量機(jī)算法、樸素貝葉斯算法的總體分類(lèi)精度分別為90.22%、96.23%和96.79%。在高維分類(lèi)特征集中,部分特征引起地類(lèi)間的混淆,通過(guò)對(duì)特征集的優(yōu)化和降維,可提高分類(lèi)精度。然而當(dāng)優(yōu)化特征集仍具有較高的維度時(shí),隨機(jī)森林算法更適合處理高維特征,表現(xiàn)出更好的性能。
不同特征選擇方案評(píng)估中,各方案不同地類(lèi)的錯(cuò)分誤差和漏分誤差分別如圖4a和圖4b所示。裸地、宅基地的錯(cuò)分誤差較大,裸地、道路、水渠、草地的漏分誤差較大。
草地主要分布于農(nóng)田邊緣以及道路和水渠兩側(cè)的洼地里,所處地勢(shì)較低,且植株較矮。由于相似的地理位置,當(dāng)引入地形特征時(shí),草地與水渠、水田之間的混淆增大,錯(cuò)分和漏分誤差增大。在影像獲取期間,草地、林地和旱地在可見(jiàn)光波段的光譜特征相似,且本研究對(duì)各地類(lèi)以統(tǒng)一尺度進(jìn)行分割,部分草地和林地形態(tài)特征相似;這些因素造成草地、林地和旱地之間的誤分。裸地、干涸的水渠以及部分宅基地具有相似的光譜特征,道路與水渠對(duì)象具有相似的形態(tài)特征,導(dǎo)致水渠、道路、宅基地、裸地之間的誤分現(xiàn)象。
若不同地類(lèi)間特征取值相似,特征取值差異可能由數(shù)據(jù)噪聲決定,實(shí)際分類(lèi)結(jié)果受噪聲方向和取值的影響。引入多類(lèi)特征,有利于從多角度描述各地類(lèi)特點(diǎn),減小錯(cuò)分和漏分誤差。本研究形態(tài)特征的低效可能由采用統(tǒng)一的分割尺度造成,在后續(xù)研究中,可嘗試多尺度分割方式,增強(qiáng)形態(tài)特征對(duì)類(lèi)型的描述能力。
圖4 不同特征選擇方案錯(cuò)分誤差和漏分誤差
基于優(yōu)化特征集,采用不同分類(lèi)算法進(jìn)行面向?qū)ο蠓诸?lèi),各土地利用類(lèi)型的錯(cuò)分誤差和漏分誤差分別如圖5a和圖5b所示。隨機(jī)森林算法對(duì)各個(gè)地類(lèi)的錯(cuò)分誤差和漏分誤差均較小,邏輯回歸算法對(duì)于各個(gè)地類(lèi)的分類(lèi)誤差較大。結(jié)果進(jìn)一步驗(yàn)證了隨機(jī)森林算法對(duì)高維特征的性能。
圖5 不同分類(lèi)算法錯(cuò)分誤差和漏分誤差
基于特征選擇方案1~方案5分類(lèi)的區(qū)域應(yīng)用效果如圖6所示。僅采用光譜特征進(jìn)行分類(lèi)(圖6a),水田中也有部分圖斑被錯(cuò)分為草地類(lèi)型,在區(qū)域D一帶錯(cuò)分情況嚴(yán)重,可能與該區(qū)域水田的顏色較綠、較暗,光譜特征取值與草地接近有關(guān)。區(qū)域B、C和E處較大面積的收割后水田被錯(cuò)分為裸地和水渠。而引入指數(shù)特征和形態(tài)特征時(shí)(圖6b和圖6c),上述錯(cuò)分現(xiàn)象沒(méi)有改善,反而在A區(qū)域和G區(qū)域部分地類(lèi)被錯(cuò)分為水渠,E區(qū)域錯(cuò)分有進(jìn)一步加劇的現(xiàn)象?;谒刑卣黝?lèi)型的方案(圖6e)分類(lèi)時(shí),區(qū)域F處仍有部分水田錯(cuò)分為草地,區(qū)域C、E處部分水田錯(cuò)分為裸地和水渠。但上述各區(qū)域的錯(cuò)分現(xiàn)象有所改善,分類(lèi)效果最好,所得結(jié)果更接近研究區(qū)實(shí)際情況。
注:字母A~G標(biāo)記了誤分類(lèi)發(fā)生的區(qū)域。
基于優(yōu)化特征集,不同分類(lèi)算法的區(qū)域應(yīng)用效果如圖7所示。采用隨機(jī)森林算法的分類(lèi)結(jié)果(圖7d)更符合實(shí)際情況,但仍存在個(gè)別區(qū)域的錯(cuò)分。采用貝葉斯算法的分類(lèi)結(jié)果(圖7a)較好,但在H區(qū)域處部分水田被錯(cuò)分為旱地,整體效果較隨機(jī)森林算法差。其余2種算法均造成大量水田、旱地與林地、草地之間的錯(cuò)分。
注:字母A~K標(biāo)記了誤分類(lèi)發(fā)生的區(qū)域。
區(qū)域B、C和E為已收獲的水田,包括規(guī)則堆放的水稻、水稻割茬和裸土。對(duì)于所有分類(lèi)試驗(yàn),在區(qū)域B和C的水田被大量錯(cuò)分為裸地、水渠,且分類(lèi)結(jié)果并未隨特征類(lèi)型增多而有明顯改善。分析其中原因,水稻割茬殘留區(qū)域光譜特征、形態(tài)特征、紋理特征、指數(shù)特征與裸地接近,僅以獨(dú)立的對(duì)象為單位提取的特征無(wú)法將其與水渠和裸地進(jìn)行區(qū)分。然而它與田中堆放的稻垛相鄰,在后續(xù)研究中可嘗試增加描述其與稻垛對(duì)象之間關(guān)系的特征對(duì)其進(jìn)行分類(lèi)。
本研究以吉林省德惠市一農(nóng)耕區(qū)為研究區(qū),借助無(wú)人機(jī)拍攝影像,提取分類(lèi)特征,進(jìn)行面向?qū)ο笸恋乩梅诸?lèi),并分析各類(lèi)特征、不同算法對(duì)分類(lèi)效果的影響,得到如下結(jié)論:
1)隨機(jī)森林算法更適合處理高維特征?;跓o(wú)人機(jī)低空影像,采用面向?qū)ο蟮碾S機(jī)森林算法可以有效進(jìn)行研究區(qū)土地利用分類(lèi),得到較理想的分類(lèi)結(jié)果,分類(lèi)總體精度達(dá)93.72%以上,Kappa系數(shù)達(dá)0.937以上。
2)基于無(wú)人機(jī)影像,在數(shù)字?jǐn)z影測(cè)量專(zhuān)業(yè)軟件提取區(qū)域DSM,提取地形特征,并將其引入分類(lèi)特征集,能夠輔助土地利用分類(lèi)并獲得更高的分類(lèi)精度,分類(lèi)總體精度由96.93%提高到97.77%,Kappa系數(shù)由0.969提高到0.978。
3)光譜特征、指數(shù)特征、地形特征、紋理特征和形態(tài)類(lèi)型共同參與的分類(lèi)方法獲得的分類(lèi)精度最高,其中光譜特征、指數(shù)特征、地形特征和紋理特征對(duì)分類(lèi)起重要作用,研究區(qū)內(nèi)形態(tài)特征為次要特征,部分形態(tài)特征在實(shí)際分類(lèi)過(guò)程中起到干擾作用。
相關(guān)文獻(xiàn)研究表明超高空間分辨率的無(wú)人機(jī)影像具有大量可用的形態(tài)及空間關(guān)系特征,能夠提高分類(lèi)精度。本研究中,部分形態(tài)特征對(duì)分類(lèi)結(jié)果卻起到了相反的作用,分析原因是由于過(guò)高的空間分辨率帶來(lái)了部分冗余地物信息,僅依賴(lài)于常規(guī)的分割方法,采用統(tǒng)一參數(shù)對(duì)區(qū)域進(jìn)行分割,不足以得到最優(yōu)結(jié)果,導(dǎo)致形態(tài)特征沒(méi)有充分發(fā)揮作用。后續(xù)研究中可進(jìn)一步調(diào)整影像分割方案,提高形態(tài)特征的可用性。
[1] 肖艷,姜琦剛,王斌,等. Relief F和PSO混合特征選擇的面向?qū)ο笸恋乩梅诸?lèi)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(4):211-216.
Xiao Yan, Jiang Qigang, Wang Bin, et al. Object based land-use classification based on hybrid feature selection method of combining Relief F and PSO[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(4): 211-216. (in Chinese with English abstract)
[2] Dronova I. Object-based image analysis in wetland research: A review[J]. Remote Sensing, 2015, 7(5): 6380-6413.
[3] Shruthi R B, Kerle N, Jetten V, et al. Object-based gully system prediction from medium resolution imagery using Random Forests[J]. Geomorphology, 2014, 216: 283-294.
[4] 戴建國(guó),張國(guó)順,郭鵬,等. 基于無(wú)人機(jī)遙感可見(jiàn)光影像的北疆主要農(nóng)作物分類(lèi)方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2018,34(18):122-129.
Dai Jianguo, Zhang Guoshun, Guo Peng, et al. Classification method of main crops in northern Xinjiang based on UAV visible waveband images[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(18): 122-129. (in Chinese with English abstract)
[5] 劉斌,史云,吳文斌,等. 基于無(wú)人機(jī)遙感可見(jiàn)光影像的農(nóng)作物分類(lèi)[J]. 中國(guó)農(nóng)業(yè)資源與區(qū)劃,2019,40(8):55-63.
Liu Bin, Shi Yun, Wu Wenbin, et al. Crop classification based on UAV remote sensing images[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2019, 40(8): 55-63. (in Chinese with English abstract)
[6] Zhang Q, Qin R, Huang X, et al. Classification of ultra-high resolution orthophotos combined with DSM using a dual morphological top hat profile[J]. Remote Sensing, 2015, 7(12): 16422-16440.
[7] 耿仁方,付波霖,蔡江濤,等. 基于無(wú)人機(jī)影像和面向?qū)ο箅S機(jī)森林算法的巖溶濕地植被識(shí)別方法研究[J]. 地球信息科學(xué)學(xué)報(bào),2019,21(8):1295-1306.
Geng Renfang, Fu Bolin, Cai Jiangtao, et al. Object-based karst wetland vegetation classification method using unmanned aerial vehicle images and random forest algorithm[J]. Journal of Geo-information Science, 2019, 21(8): 1295-1306. (in Chinese with English abstract)
[8] 馮家莉,劉凱,朱遠(yuǎn)輝,等. 無(wú)人機(jī)遙感在紅樹(shù)林資源調(diào)查中的應(yīng)用[J]. 熱帶地理,2015,35(1):35-42.
Feng Jiali, Liu Kai, Zhu Yuanhui, et al. Application of unmanned aerial vehicles to mangrove resources monitoring[J]. Tropical Geography, 2015, 35(1): 35-42. (in Chinese with English abstract)
[9] 蘭玉彬,鄧小玲,曾國(guó)亮. 無(wú)人機(jī)農(nóng)業(yè)遙感在農(nóng)作物病蟲(chóng)草害診斷應(yīng)用研究進(jìn)展[J]. 智慧農(nóng)業(yè),2019,1(2):1-19.
Lan Yubin, Deng Xiaoling, Zeng Guoliang. Advances in diagnosis of crop diseases, pests and weeds by UAV remote sensing[J]. Smart Agriculture, 2019, 1(2): 1-19. (in Chinese with English abstract)
[10] 朱姜蓬,岑海燕,何立文,等. 農(nóng)情監(jiān)測(cè)多旋翼無(wú)人機(jī)系統(tǒng)開(kāi)發(fā)及性能評(píng)估[J]. 智慧農(nóng)業(yè),2019,1(1):43-52.
Zhu Jiangpeng, Cen Haiyan, He Liwen, et al. Development and performance evaluation of a multi-rotor unmanned aircraft system for agricultural monitoring[J]. Smart Agriculture, 2019, 1(1): 43-52. (in Chinese with English abstract)
[11] 陸博迪,孟迪文,陸鳴,等. 無(wú)人機(jī)在重大自然災(zāi)害中的應(yīng)用與探討[J]. 災(zāi)害學(xué),2011,26(4):122-126.
Lu Bodi, Meng Diwen, Lu Ming, et al. Application and exploration of unmanned aerial vehicle in major natural disasters[J]. Journal of Catastrophology, 2011, 26(4): 122-126. (in Chinese with English abstract)
[12] 王曉剛,高飛云,楊磊,等. 無(wú)人機(jī)遙感技術(shù)在自然災(zāi)害應(yīng)急中的應(yīng)用及前景[J].四川地質(zhì)學(xué)報(bào),2019,39(1):158-163.
Wang Xiaogang, Gao Feiyun, Yang Lei, et al. The application of unmanned aerial vehicle remote sensing technology to natural disaster emergency[J]. Acta Geologica Sichuan, 2019, 39(1): 158-163. (in Chinese with English abstract)
[13] Zhang L, Huang X, Huang B, et al. A pixel shape index coupled with spectral information for classification of high spatial resolution remotely sensed imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(10): 2950-2961.
[14] Millard K, Richardson M. On the importance of training data sample selection in random forest image classification: A case study in peatland ecosystem mapping[J]. Remote Sensing, 2015, 7(7): 8489-8515.
[15] Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[16] Belgiu M, Dr?gu? L. Random forest in remote sensing: A review of applications and future directions[J]. Isprs Journal of Photogrammetry and Remote Sensing, 2016, 114: 24-31.
[17] 馬玥,姜琦剛,孟治國(guó),等. 基于隨機(jī)森林算法的農(nóng)耕區(qū)土地利用分類(lèi)研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2016,47(1):297-303.
Ma Yue, Jiang Qigang, Meng Zhiguo, et al. Random forest classification of land use in farming area[J]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(1): 297-303. (in Chinese with English abstract)
[18] 劉舒. 吉林西部濕地分布及NPP時(shí)空動(dòng)態(tài)變化研究[D]. 長(zhǎng)春:吉林大學(xué),2018.
Liu Shu. Spatial and Temporal Dynamic Changes of Wetland in the West of Jilin Province and its NPP[D]. Changchun: Jilin University, 2018. (in Chinese with English abstract)
[19] Yao H, Qin R, Chen X. Unmanned aerial vehicle for remote sensing applications: A review[J]. Remote Sensing, 2019, 11(12): 1443.
[20] 劉凱,龔輝,曹晶晶,等. 基于多類(lèi)型無(wú)人機(jī)數(shù)據(jù)的紅樹(shù)林遙感分類(lèi)對(duì)比[J]. 熱帶地理,2019,39(4):492-501.
Liu Kai, Gong Hui, Cao Jingjing, et.al. Comparison of mangrove remote sensing classification based on multi-type UAV data[J]. Tropical Geography, 2019, 39 (4): 492-501. (in Chinese with English abstract)
[21] 劉斌. 基于無(wú)人機(jī)遙感影像的農(nóng)作物分類(lèi)研究[D]. 北京:中國(guó)農(nóng)業(yè)科學(xué)院,2019.
Liu Bin. Classification of Crops Based on UAV Remote Sensing Images[D]. Beijing: Chinese Academy of Agricultural Sciences Dissertation, 2019. (in Chinese with English abstract)
[22] 淮賀舉,李存軍,李奇峰,等. 東北地區(qū)春玉米物候期時(shí)空動(dòng)態(tài)變化特征[J]. 玉米科學(xué),2019,27(1):85-90.
Huai Heju, Li Cunjun, Li Qifeng, et. al. Changes of spring maize phenology from 1981 to 2012 in the northeast plain of China[J]. Journal of Maize Sciences, 2019, 27(1): 85-90. (in Chinese with English abstract)
[23] 中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)GB/T 21010-2017,土地利用現(xiàn)狀分類(lèi)[S]. 北京:中國(guó)標(biāo)準(zhǔn)出版社,2017.
[24] 李廣. 基于無(wú)人機(jī)遙感技術(shù)的玉米種植分布信息提取方法研究[D]. 楊凌:西北農(nóng)林科技大學(xué),2016.
Li Guang. Research on the Extraction Method of Maize Planting Distribution Information Based on the UAV Remote Sensing System[D]. Yangling: Northwest A&F University, 2016. (in Chinese with English abstract).
[25] Dr?gu? L, Tiede D, Levick S R. ESP: A tool to estimate scale parameters for multiresolution image segmentation of remotely sensed data[J]. International Journal of Geographical Information Science, 2010, 24(6): 859-871.
[26] 井然,鄧?yán)冢w文吉,等. 基于可見(jiàn)光植被指數(shù)的面向?qū)ο鬂竦厮脖惶崛》椒╗J]. 應(yīng)用生態(tài)學(xué)報(bào),2016,27(5):1427-1436.
Jing Ran, Deng Lei, Zhao Wenji, et al. Object-oriented aquatic vegetation extracting approach based on visible vegetation indices[J]. Chinese Journal of Applied Ecology, 2016, 27(5): 1427-1436. (in Chinese with English abstract)
[27] 劉舒,姜琦剛,馬玥,等. 基于多目標(biāo)遺傳隨機(jī)森林特征選擇的面向?qū)ο鬂竦胤诸?lèi)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2017,48(1):119-127.
Liu Shu, Jiang Qigang, Ma Yue, et. al. Object-oriented wetland classification based on hybrid feature selection method combining with Relief F, multi-objective genetic algorithm and random forest[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(1): 119-127. (in Chinese with English abstract)
Object-oriented land use classification based on ultra-high resolution images taken by unmanned aerial vehicle
Liu Shu1, Zhu Hang2※
(1.,,130118,; 2.,,130022,)
Unmanned aerial vehicle (UAV) has been increasingly used to aid agricultural production and land management, and this paper investigates the feasibility of using ultra-high resolution UAV images to differentiate land usage. We took a farmland at Dehui of Jilin province as an example and acquired its UAV images. The digital surface model (DSM) and the digital orthophoto map (DOM) of the region was generated using the digital photogrammetry software. We then calculated the regional terrain factors and the vegetation indices, and combined them with the original orthophoto model to construct the baseline images for land use classification. The tool of estimation of scale parameters (ESP) was used to extract the optimal scale for segmentation, and a level of objects was constructed after processing the multi-scale segmentation based on the optimal value of each parameter. Terrain and morphological features of each object was used for the classification. It included two steps. The first one was to perform an object-oriented classification of all the five features based on the random forest algorithm. We used a five-feature classifications to analyze the impact of different features. The first one only used the spectrum feature to classify and the index features, morphological features, terrain features and textural features were added consecutively for further classification. The overall accuracy, kappa coefficient, the omission errors and the commission errors for each feature were compared. In the second step, Boruta feature selection method was applied to the original feature space to obtain an optimal feature subset. Based on the optimal feature subset, land use classification was conducted using the random forest algorithm, naive Bayesian algorithm, logistic regression method and the support vector machine (SVM). Using the same optimal feature subset, the influence of each method on the classification was tested. The results showed that the accuracy of the five feature selection schemes was 93.72%, 97.35%, 96.93%, 97.77%, and 98.04% respectively. Adding morphological features reduced accuracy, while adding other features improved accuracy. The scheme with five features gave the best result. The commission was mainly between the bare land and residential land, and the omissions were mainly among grassland, water canals and roads. The confusion between them was likely to be caused by the similarity of spectral, morphology, textural properties and their similar positions. In this study, the important features for classification were spectrum features, textural features, index features and terrain features, and the least important features were morphological features. There were 72 features passing the Boruta test and forming the optimal feature subset. Based on this feature space, the overall accuracy with the above four different algorithms was 98.19%, 96.79%, 90.22% and 96.23% respectively. The classification using the random forest algorithm gave the best result. In conclusion, adding the terrain features can assist classification of land coverage and improve accuracy. Compared with other algorithms, the random forest algorithm is most robust in classification of land coverage in using high dimensional feature space.
remote sensing; land use type; images taken by UAV; object-oriented; feature selection scheme; random forest
劉 舒,朱 航. 基于超高空間分辯率無(wú)人機(jī)影像的面向?qū)ο笸恋乩梅诸?lèi)方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2020,36(2):87-94.doi:10.11975/j.issn.1002-6819.2020.02.011 http://www.tcsae.org
Liu Shu, Zhu Hang. Object-oriented land use classification based on ultra-high resolution images taken by unmanned aerial vehicle[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(2): 87-94. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.02.011 http://www.tcsae.org
2019-09-25
2020-01-07
國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2016YFD0200701)
劉 舒,講師,博士,主要從事遙感地學(xué)和環(huán)境遙感研究。Email:liushu8877@126.com
朱 航,副教授,從事航空遙感及多源信息融合技術(shù)研究。Email:hangzhu@jlu.edu.cn
10.11975/j.issn.1002-6819.2020.02.011
TP79
A
1002-6819(2020)-02-0087-08