楊彥榮 宋榮杰 胡國強(qiáng) 張桓
摘? 要: 為準(zhǔn)確、快速地從高分影像中獲取蘋果種植分布信息,以QuickBird遙感影像為數(shù)據(jù)源,首先采用分形理論和灰度共生矩陣(GLCM)提取紋理特征,然后將提取的分形紋理和GLCM紋理特征分別與光譜特征組合,最后開展隨機(jī)森林分類實(shí)驗(yàn),對不同分類特征和不同分類方法的實(shí)驗(yàn)結(jié)果進(jìn)行比較。結(jié)果表明:光譜+GLCM紋理識別蘋果園的效果明顯優(yōu)于光譜特征和光譜+分形紋理,其蘋果園提取精度為95.99%,比光譜分類顯著提高11.83%,比光譜+分形紋理提高1.34%;在相同分類特征下隨機(jī)森林分類結(jié)果最高,其中,隨機(jī)森林結(jié)合光譜+GLCM紋理分類精度最高,總體精度和Kappa系數(shù)分別為95.30%和0.94,較最小距離和支持向量機(jī)分類有明顯提高。
關(guān)鍵詞: 信息提取; 高分影像; 分形紋理; 灰度共生矩陣; 隨機(jī)森林; 支持向量機(jī)
中圖分類號: TN911.73?34; TP79; S127? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識碼: A? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)03?0040?05
Apple orchard remote sensing extraction based on random forest and texture features
YANG Yanrong1, SONG Rongjie2, HU Gouqiang1, ZHANG Huan2
(1. Network & Education Technology Center, Northwest A & F University, Yangling 712100, China;
2. College of Information Engineering, Northwest A & F University, Yangling 712100, China)
Abstract: In order to obtain the information of apple cultivation and distribution by high resolution image accurately and rapidly, QuickBird remote sensing image is taken as the data source, and fractal theory and gray level co?occurrence matrix (GLCM) are adopted to extract the texture features, then the extracted fractal texture features and GLCM texture features are combined with spectrum features respectively. The random forest classification experiments are conducted, and the experimental results of different classification features and classification methods are compared. The results show that effect of spectrum plus GLCM texture is obviously superior to that of spectrum features and spectrum plus fractal texture in identifying apple orchard. This method′s extraction accuracy of apple orchard is 95.99%, which is significantly 11.83% higher than that of spectrum classification and 1.34% higher than that of spectrum plus fractal texture. The effect of the random forest classification is the best under the condition of the same classification features, among which random forest classification combining spectrum plus GLCM texture classification achieved the highest accuracy (overall accuracy and Kappa coefficient are 95.30% and 0.94 respectively), which has been improved significantly in comparison with minimum distance classification and support vector machine (SVM) classification.
Keywords: information extraction; high resolution image; fractal texture; GLCM; random forest; SVM
0? 引? 言
我國是世界上蘋果種植面積和產(chǎn)量最大的國家。陜西省是我國優(yōu)質(zhì)蘋果生產(chǎn)區(qū)和集中種植區(qū),蘋果栽植面積和產(chǎn)量均位列全國第一,蘋果產(chǎn)業(yè)已成為陜西省特色農(nóng)業(yè)的重要組成部分,也是推動農(nóng)民脫貧創(chuàng)收的重要途徑[1]。因此,利用遙感技術(shù)準(zhǔn)確、快速地掌握蘋果園的空間分布格局和規(guī)模,對于蘋果的生產(chǎn)管理和蘋果產(chǎn)業(yè)的可持續(xù)發(fā)展具有重要意義。近年來,隨著遙感技術(shù)的不斷進(jìn)步,可以獲得的遙感影像的種類越來越多,遙感影像的分辨率也越來越高,因其具有實(shí)時(shí)、宏觀和快捷等優(yōu)點(diǎn),遙感影像被廣泛應(yīng)用于農(nóng)作物的面積監(jiān)測和土地利用等研究領(lǐng)域,并取得了成功[2?3]。QuickBird遙感影像能夠提供多種空間分辨率、多種光譜分辨率和多源遙感數(shù)據(jù)特征,更加精細(xì)地為遙感作物識別提供新的數(shù)據(jù)來源,已成為提高農(nóng)作物識別精度的有效途徑[4?5]。
在分類方法方面,目前,針對不同的遙感影像有很多種分類方法,諸如最大似然分類(Maximum Likelihood Classification,MLC)、神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)、最小距離分類(Minimum Distance Classification,MDC)、支持向量機(jī)(Support Vector Machine,SVM)、隨機(jī)森林(Random Forests,RF)等。其中,隨機(jī)森林是一種新型高效的組合決策樹分類方法,采用二進(jìn)制分割數(shù)據(jù)的方法解決分類和回歸問題,具有實(shí)現(xiàn)簡單、分類速度快、分類精度高、抗噪聲能力強(qiáng)的優(yōu)點(diǎn),目前在農(nóng)作物信息提取方面被廣泛使用[6?8],但對蘋果園信息提取的研究未見系統(tǒng)報(bào)道。
本文以QuickBird遙感影像為數(shù)據(jù)源,綜合利用影像的光譜和紋理特征構(gòu)建不同分類特征、不同分類方法的分類模型,并通過對比單源光譜特征、光譜+GLCM紋理和光譜+分形紋理特征以及最小距離、支持向量機(jī)和隨機(jī)森林分類方法對蘋果園提取的優(yōu)勢和劣勢,探索利用QuickBird遙感影像數(shù)據(jù)進(jìn)行蘋果園有效識別,為基于遙感技術(shù)準(zhǔn)確、快速地掌握蘋果園種植的規(guī)模和空間分布,以及客觀評價(jià)其發(fā)展現(xiàn)狀提供數(shù)據(jù)支撐。
1? 研究區(qū)與數(shù)據(jù)源
1.1? 研究區(qū)概況
扶風(fēng)縣位于陜西省關(guān)中平原西部,地理坐標(biāo)為107°45′00″E~108°03′28″E,34°12′43″N~34°38′10″N,主要地貌為平原、臺、塬地,地勢由西北向東南傾斜,北高南低,該地區(qū)四季分明,屬于大陸性濕潤季風(fēng)氣候,光照充足,雨量豐沛,全年平均氣溫為12.4 ℃,環(huán)境條件適宜種植蘋果,是國家優(yōu)質(zhì)蘋果生產(chǎn)基地縣,素有“蘋果之鄉(xiāng)”的美譽(yù)。
研究區(qū)位于扶風(fēng)縣東北部召公鎮(zhèn),作為扶風(fēng)縣八大鎮(zhèn)之一,召公鎮(zhèn)是扶風(fēng)縣主要蘋果種植區(qū),蘋果種植歷史悠久,蘋果面積達(dá)2.8萬畝,有利于開展蘋果園提取研究。結(jié)合人工判讀和野外實(shí)地調(diào)查,影像內(nèi)包含的地物類型及所占研究區(qū)總面積比例分別為蘋果園36.03%、玉米33.82%、居民地10.01%、林地9.19%、裸地6.46%、道路3.84%、水渠0.65%。
1.2? 遙感數(shù)據(jù)預(yù)處理
綜合考慮數(shù)據(jù)的分辨率、圖像獲取的方式和蘋果的物候期等多方面因素,實(shí)驗(yàn)數(shù)據(jù)取自QuickBird高分影像數(shù)據(jù),影像成像時(shí)間為2014年7月25日,該影像由兩個(gè)影像數(shù)據(jù)構(gòu)成,一個(gè)為單波段的全色影像,其分辨率為0.6 m,波長為0.45~0.90 μm;另外一個(gè)為包含藍(lán)、綠、紅、近紅外4個(gè)波段的多光譜影像,其分辨率分別為2.4 m,其中藍(lán)波段波長為0.45~0.52 μm,綠波段波長為0.52~0.60 μm,紅波段波長為0.63~0.69 μm,近紅外波段波長為0.45~0.52 μm。根據(jù)研究需要,首先在ENVI軟件中對遙感影像進(jìn)行幾何精校正和正射校正,然后為減少紋理提取的計(jì)算量,并與多光譜影像分辨率保持一致,將校正好的0.61 m分辨率的全色影像重采樣為2.4 m,最終裁剪了一塊1 412×1 412像素的圖像進(jìn)行分類實(shí)驗(yàn)。
依據(jù)地物光譜特征和紋理結(jié)構(gòu)特征,經(jīng)過目視解譯,研究區(qū)蘋果園分布面積最大,影像內(nèi)包含的地物有蘋果園、玉米、居民地、林地、裸地、道路和水渠7種類型。實(shí)驗(yàn)影像近紅外、紅和綠波段假彩色合成圖像如圖1所示。
1.3? 樣本選取
遙感影像分類研究中,常用的選取訓(xùn)練樣本方法有單個(gè)像元、種子像元和多邊形塊方法。為了分類訓(xùn)練和分類精度評價(jià),本文利用ENVI 5.3軟件的感興趣區(qū)工具以不規(guī)則多邊形塊為單元隨機(jī)選取6 860像元,其中2 433像元作為訓(xùn)練樣本,剩余的4 427像元作為驗(yàn)證樣本,如表1所示。
2? 研究方法
2.1? 紋理提取方法
2.1.1? 分形紋理提取
分形理論以分析維數(shù)為基礎(chǔ),通過分形維數(shù)計(jì)算能夠反映遙感圖像紋理的復(fù)雜度,目前已廣泛應(yīng)用于遙感影像分類中[9]。計(jì)算分形維數(shù)方法眾多,常用的方法有計(jì)盒維數(shù)法、雙毯覆蓋法、三角棱柱法、空隙法等。本文采用雙毯覆蓋模型來計(jì)算分形維數(shù)以提取紋理特征,基本思想為:用遙感影像像素灰度值代表空間深度,則形成一個(gè)三維空間的紋理曲面,若以該表面中某點(diǎn)為中心,在距離該中心點(diǎn)曲面上下[ε]處構(gòu)成一個(gè)厚度為2[ε]的“毯子”,分形維數(shù)與毯子表面積對應(yīng)關(guān)系為:
式中:[D]為分形維數(shù);[ε]為面積計(jì)算尺度;[A(ε)]為毯子表面積函數(shù)。首先對于不同的[ε]值,分別計(jì)算lg [A(ε)]和lg [ε]的值,然后再利用最小二乘線性回歸擬合,得到直線(lg [A(ε)],lg [ε])的斜率[H],再由分形維度與斜率的關(guān)系函數(shù)[D=2-H]求出分形維數(shù)[D]。
本文在Matlab環(huán)境下,用重采樣后的QuickBird全色波段作為提取紋理特征的基礎(chǔ)數(shù)據(jù),通過不同滑動窗口計(jì)算每個(gè)像素的分形維數(shù),并將其取值擴(kuò)展到0~255,最終得到研究區(qū)的分形紋理特征,如圖2所示。
2.1.2? GLCM紋理提取
灰度共生矩陣GLCM方法是由文獻(xiàn)[10]提出的一種用來分析圖像紋理特征的重要方法。GLCM通過估算兩個(gè)像素在不同空間位置和方向同時(shí)出現(xiàn)的聯(lián)合概率密度來反映圖像在方向、間隔、變化幅度及快慢上的綜合信息。常見的8種統(tǒng)計(jì)量為:角二階矩(Angular Secondmoment)、對比度(Contrast)、相關(guān)性(Correlation)、熵(Entropy)、均值(Mean)、方差(Variance)、相異性(Dissimilarity)和均勻性(Homogeneity)。研究表明,對于遙感圖像來說,角二階矩、相關(guān)性、對比度和熵這4種紋理特征效果較好,能夠有效地表征地物的紋理信息[11]。因此,本文采用這4個(gè)紋理特征參與影像分類。使用ENVI 5.3提取的像元間距為1、灰度級量化為64級、選擇3×3的窗口在4個(gè)方向取平均值的紋理特征圖像如圖3所示。
2.2? 隨機(jī)森林分類方法
隨機(jī)森林是Breiman于2001年提出的由多棵CART決策樹組合構(gòu)成的一種非常有效的機(jī)器學(xué)習(xí)算法。該算法采用基尼系數(shù)對樣本數(shù)據(jù)進(jìn)行二值分割,從而實(shí)現(xiàn)對樣本數(shù)據(jù)的分類,采用加權(quán)平均值對數(shù)據(jù)進(jìn)行訓(xùn)練以實(shí)現(xiàn)回歸問題。隨機(jī)森林算法適用于處理高維數(shù)據(jù)且運(yùn)行速度相對較快,近年來在遙感影像分類領(lǐng)域得到了廣泛應(yīng)用。
隨機(jī)森林算法基本思想:
1) 利用bootstrap自助抽樣技術(shù),每次從原始樣本中有放回的抽取[K]個(gè)樣本,重復(fù)[K]次形成[K]個(gè)訓(xùn)練樣本集,在隨機(jī)抽取過程中,有的樣本多次被抽取,被抽取到的樣本稱為袋內(nèi)樣本,約占總樣本數(shù)的[23];而有的樣本從未被抽取到,未被抽取到的樣本稱為袋外(OOB)樣本[12],約占總樣本數(shù)的[13],袋外樣本用于樣本特征空間優(yōu)化和評估模型整體性能。
2) 針對[K]個(gè)訓(xùn)練樣本逐一進(jìn)行決策樹構(gòu)建,在每棵樹的構(gòu)建過程中,從[M]個(gè)特征中隨機(jī)抽選[m]([m≤M])個(gè)特征,之后使用完全分裂的方式進(jìn)行內(nèi)部節(jié)點(diǎn)劃分,完成決策樹構(gòu)建,最終產(chǎn)生由[K]棵CART決策樹組成的森林。
3) 每棵樹單獨(dú)完成分類后,新樣本的類別依據(jù)集合[K]棵決策樹的預(yù)測結(jié)果,并采用投票的方式得出分類結(jié)果。
目前可以利用多種語言軟件平臺實(shí)現(xiàn)隨機(jī)森林算法,本文使用EnMAP?Box軟件實(shí)現(xiàn)對整個(gè)遙感圖像分類,獲得研究區(qū)土地利用分類圖。隨機(jī)森林算法有兩個(gè)重要參數(shù),即[Mtry]和[Ntree]。其中,[Mtry]表示每個(gè)節(jié)點(diǎn)所選取的預(yù)測變量個(gè)數(shù);[Ntree]表示待生成決策樹數(shù)目。通過多次實(shí)驗(yàn),綜合考慮分類精度和計(jì)算效率,最終將[Mtry]設(shè)置為全部特征平方根,[Ntree]設(shè)值為200進(jìn)行分類。
3? 結(jié)果與分析
為分析紋理窗口大小對分類結(jié)果的影響,分別選用5×5像元、7×7像元、9×9像元、11×11像元大小的窗口提取GLCM紋理和分形紋理,并與單源光譜特征組合進(jìn)行隨機(jī)森林分類實(shí)驗(yàn),總體分類精度如表2所示。
由表2可知,當(dāng)分形紋理和GLCM紋理窗口大小分別為7×7像元,9×9像元時(shí)分類效果最佳。故本文在提取分形紋理時(shí)采用7×7像元大小的窗口,在提取GLCM紋理時(shí)采用9×9像元大小的窗口。
為比較不同分類特征識別蘋果園的效果,分別將單源光譜特征、光譜特征結(jié)合GLCM紋理、光譜特征結(jié)合分形紋理共3種分類特征分別進(jìn)行隨機(jī)森林分類實(shí)驗(yàn),分類結(jié)果如圖4所示。
對比分析圖4的分類結(jié)果,可看出結(jié)合紋理特征分類后的實(shí)驗(yàn)效果有所提高。從圖4a)中僅利用單源光譜分類的結(jié)果中可以看出,由于蘋果與玉米、林木都屬于植被,光譜特征比較相似,分類結(jié)果椒鹽現(xiàn)象嚴(yán)重;多光譜結(jié)合分形紋理特征后,被誤分的像元有所減少,如圖4b)所示,但效果不太明顯。圖4c)為多光譜結(jié)合GLCM紋理分類后的結(jié)果,蘋果園提取結(jié)果較完整,與玉米、林木的混淆現(xiàn)象明顯改善,總體分類效果得到明顯改善。
為驗(yàn)證隨機(jī)森林分類方法對蘋果園識別的效果,選用相同的訓(xùn)練樣本和驗(yàn)證樣本,分別采用遙感圖像分類中常用的MDC、SVM分類方法對單源光譜、光譜結(jié)合紋理特征進(jìn)行分類實(shí)驗(yàn),得到不同分類方法的結(jié)果如表3所示。
從表4可知:當(dāng)采用相同分類特征時(shí),RF分類的蘋果園精度和總體精度高于MDC和SVM分類結(jié)果;與MDC分類相比,蘋果園精度和總體精度最高分別提升3.92%和3.51%;與SVM分類相比,蘋果園精度和總體精度最高分別提升1.98%和2.74%;綜合蘋果園精度和總體精度來看,RF分類的精度是最好的,表明RF提取蘋果園效果和穩(wěn)定性好。
此外,RF,SVM,MDC三種分類算法中采用光譜與GLCM紋理特征時(shí)的蘋果園精度和總體精度高于單一光譜特征,高于光譜與分形紋理特征;與單源光譜分類特征相比,總體精度分別提升10.22%,8.02%,9.23%;與光譜與分形紋理特征相比,總體精度分別提升1.13%,0.22%,0.45%,表明GLCM紋理對不同算法的普適性好。綜合圖4和表3可知,多光譜+GLCM紋理特征和RF分類方法提取蘋果園的效果最佳。
4? 結(jié)? 論
本文嘗試以QuickBird高分影像為數(shù)據(jù)源,綜合運(yùn)用光譜特征、GLCM紋理特征和分形紋理特征,利用隨機(jī)森林監(jiān)督分類技術(shù)對研究區(qū)進(jìn)行土地利用分類,并在此基礎(chǔ)上實(shí)現(xiàn)蘋果園分布信息的自動提取。通過對比不同分類特征的分類精度,發(fā)現(xiàn)采用光譜+窗口大小為9×9像元提取的GLCM紋理特征的分類精度最高,其蘋果園提取精度和總體分類精度分別為95.99%和95.30%,比光譜+分形紋理分類提高1.34%和1.13%,比采用單源光譜特征分類顯著提高11.83%和10.22%,光譜與紋理信息結(jié)合能有效提升蘋果園提取精度和總體分類精度。通過對比隨機(jī)森林、最小距離和支持向量機(jī)分類方法,結(jié)果表明,在采用相同分類特征時(shí)隨機(jī)森林的蘋果園提取精度和總體分類精度最高,與最小距離分類相比,分類精度提升幅度超過2%,與支持向量機(jī)分類相比,分類精度提升幅度超過1%,表明隨機(jī)森林分類提取蘋果園效果和穩(wěn)定性好。
注:本文通訊作者為宋榮杰。
參考文獻(xiàn)
[1] 高義民.陜西渭北蘋果園土壤養(yǎng)分特征時(shí)空分析及施肥效應(yīng)研究[D].楊凌:西北農(nóng)林科技大學(xué),2013.
[2] 王大鵬,王周龍,李德一.基于NDVI紋理的山東丘陵地區(qū)SPOT?5影像果園信息識別研究[J].測繪科學(xué),2007,32(1):126?127.
[3] LI Y, GONG J, IBRAHIM A N, et al. Orchard identification using landform and landscape factors based on a spatial?temporal classification framework [J]. International journal of remote sensing, 2014, 35(6): 2118?2135.
[4] 楊閆君,黃彥,田慶久,等.基于高分一號衛(wèi)星WFV 影像的水稻信息提取模式[J].光譜學(xué)與光譜分析,2015,35(11):3255?3261.
[5] 楊紅衛(wèi),童小華.高分辨率影像的橡膠林分布信息提取[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2014,39(4):411?416.
[6] OK A O, AKAR O, GUNGOR O. Evaluation of random forest method for agricultural crop classification [J]. European journal of remote sensing, 2012, 45(1): 421?432.
[7] DESCHAMPS B, MCNAIRN H, SHANG J, et al. Towards operational radar?only crop type classification: comparison of a traditional decision tree with a random forest classifier [J]. Canadian journal of remote sensing, 2012, 38(1): 60?68.
[8] 張曉羽,李鳳日,甄貞,等.基于隨機(jī)森林模型的陸地衛(wèi)星?8遙感影像森林植被分類[J].東北林業(yè)大學(xué)學(xué)報(bào),2016,44(6):53?57.
[9] LIANG Bingqing, WENG Qihao, TONG Xiaohua. An evaluation of fractal characteristics of urban landscape in Indianapolis, USA, using multi?sensor satellite images [J]. International journal of remote sensing, 2013, 34(3): 804?823.
[10] HARALICK R M, SHANMUGAM K. Textural features for image classification [J]. IEEE transactions on systems, man, and cybernetics, 1973, 3(6): 610?621.
[11] MAILLARD P. Comparing texture analysis methods through classification [J]. Photogrammetric engineering & remote sensing, 2003, 69(4): 357?367.
[12] BELGIU M, DRGUT L. Random forest in remote sensing: review of applications and future directions [J]. ISPRS journal of photogrammetry and remote sensing, 2016, 114: 24?31.