郭鵬程 周志易
(合肥工業(yè)大學(xué) 土木與水利工程學(xué)院, 安徽 合肥 230009)
傳統(tǒng)的面向像元的分類方法在用于土地利用分類時(shí),僅僅利用了影像的光譜信息,往往適用于中低分辨率的遙感影像[1]。隨著遙感平臺(tái)的發(fā)展與更新,高分辨率遙感影像已成為研究熱點(diǎn)[2-4],然而面向像元的分類方法不能充分利用影像中的空間結(jié)構(gòu)和紋理信息,導(dǎo)致分類結(jié)果中含有大量椒鹽噪聲[5],制約了分類精度。在最近的研究中,面向?qū)ο蟮挠跋穹治黾夹g(shù)(Object-Based Image Analysis,OBIA)在土地利用分類中有著良好的表現(xiàn),一方面因?yàn)?基于OBIA的分類的第一步是將影像分割成根據(jù)同質(zhì)性原則合并而成的多邊形影像對(duì)象,分割后的對(duì)象含有更多的語義信息[6];另一方面因?yàn)?OBIA在分類過程中能夠充分挖掘各種影像特征[7],進(jìn)而減少甚至消除“椒鹽”現(xiàn)象。
針對(duì)面向?qū)ο笥跋穹治黾夹g(shù)在遙感影像分類中的應(yīng)用,已有許多學(xué)者進(jìn)行了深入研究。袁慧潔[8]利用無人機(jī)遙感影像,采用基于規(guī)則和基于樣本的兩種面向?qū)ο蠓诸惙椒?提取出房屋、道路、植被等簡(jiǎn)單地物及背景;宋明輝[9]利用國(guó)產(chǎn)高分二號(hào)數(shù)據(jù),對(duì)影像進(jìn)行多尺度分割,建立相應(yīng)地物的分類規(guī)則,采用規(guī)則集的面向?qū)ο蠓诸惙椒▽?duì)地物進(jìn)行分類;楊朝輝等[10]使用Sentinel-2A影像,構(gòu)建面向?qū)ο蠓诸愐?guī)則,成功提取出蘇州市濕地類型;BHASKARAN等[11]利用IKONOS衛(wèi)星(伊科諾斯衛(wèi)星,一顆商業(yè)對(duì)地觀測(cè)衛(wèi)星)數(shù)據(jù),將逐像素和面向?qū)ο蟮姆诸惙椒ńY(jié)合,使用光譜、空間屬性和隸屬度函數(shù)的組合來進(jìn)行城市特征制圖,將特定類別(如白色屋頂和植被)的精度進(jìn)一步提高;SU[12]開發(fā)了一種新的用于對(duì)象層次分類特征的選擇方法,該方法能更好地減少對(duì)象層次的冗余特征,有著較高的分類精度??梢钥吹?面向?qū)ο蟮姆诸惣夹g(shù)在高分辨率遙感影像特征提取與地物分類的應(yīng)用上有著巨大的應(yīng)用前景。
本文選取了合肥市包河區(qū)作為研究區(qū)域,利用Sentinel-2高分辨率多光譜數(shù)據(jù),采用面向?qū)ο蠓诸惣夹g(shù)中的最近鄰分類,提取出六種地物類型,并與最大似然分類(Maximum Likelihood Classification, MLC)、支持向量機(jī)(Support Vector Machine, SVM)、神經(jīng)網(wǎng)絡(luò)(Neural Networks, NN)三種面向像元的分類方法比較。結(jié)果顯示,面向?qū)ο蟮姆诸惙椒艹浞掷糜跋窀黝愄卣?分類精度更高。
本文研究區(qū)位于安徽省中部長(zhǎng)江淮河流域的合肥市總面積1 400 km2??紤]到整個(gè)合肥市區(qū)域過大及計(jì)算機(jī)運(yùn)行內(nèi)存大小,本文只選擇合肥市包河區(qū)作為典型研究區(qū)。
研究使用的數(shù)據(jù)來源于歐洲航天局(European Space Agency,ESA)的Sentinel-2高分辨率多光譜影像,選擇研究區(qū)2019年4月17號(hào)的一景影像,云量為0.67,使用ESA提供的sen2cor工具對(duì)影像進(jìn)行輻射定標(biāo)、大氣校正,并在snap7.0中進(jìn)行影像重采樣、格式轉(zhuǎn)換等預(yù)處理,生成10 m分辨率的多光譜數(shù)據(jù),最后在遙感圖像處理平臺(tái)(The Environment for Visualizing Images, ENVI)5.3中進(jìn)行波段合成和矢量裁剪。
面向?qū)ο蠓诸惙椒ǖ奶幚韱卧辉偈菃蝹€(gè)像元,而是具有相似光譜特征、幾何特征及紋理特征等多元特征的影像對(duì)象[12]。幾何特征描述的是線段的形狀信息,例如周長(zhǎng)、面積、長(zhǎng)寬比、與矩形或圓形的相似性等。這類特征往往具有規(guī)則的幾何形狀,能在人工地物的識(shí)別方面發(fā)揮巨大作用,如道路、體育館、一些地區(qū)的農(nóng)業(yè)用地。相比之下,光譜和紋理特征更常用于土地利用分類,影像對(duì)象的光譜和紋理特征是通過平均其所有像素特征值來提取的。本文的研究技術(shù)路線如圖1所示。
圖1 研究技術(shù)路線
面向?qū)ο蠓诸愂紫纫獙?duì)影像進(jìn)行分割,分割效果的好壞影響著最后的分類精度。常用的分割算法有自上而下的分割,包括棋盤分割、四叉樹分割等;自下而上的分割則包括光譜差異分割、多尺度分割等[13]。
本文研究選擇的是多尺度分割算法,該算法是從單個(gè)像元開始,根據(jù)同質(zhì)性標(biāo)準(zhǔn),向上逐漸合并成較大的影像對(duì)象,直到滿足所設(shè)置的分割參數(shù)條件為止[14]。多尺度分割算法的主要參數(shù)包括分割尺度、光譜異質(zhì)性和形狀異質(zhì)性,其中形狀異質(zhì)性由光滑度和緊致度表示。異質(zhì)性F定義為[15]
F=ω×hcolor+(1-ω)×hshape
(1)
hshape=ωcompact×hcompact+(1-ωcompact)×hsmooth
(2)
式中,ω為光譜信息權(quán)重;hcolor為光譜異質(zhì)性;hshape為形狀異質(zhì)性;hcompact為緊致度;ωcompact為緊致度權(quán)重;hsmooth為光滑度。
多尺度分割影像因子的關(guān)系如圖2所示。形狀因子越高,分割后的影像對(duì)象越平滑,形狀明顯;而緊致度因子越高,分割后的影像對(duì)象邊界越細(xì)化,對(duì)象斑塊碎片化程度明顯[16],通過影像分割尺度參數(shù)(Estimation of Scale Parameters, ESP)工具進(jìn)行分割實(shí)驗(yàn),結(jié)合包河區(qū)的地物類型較多且形狀不規(guī)則的情況,確定最終的分割尺度為50,形狀因子為0.3,緊致度因子為0.5。
圖2 多尺度分割影響因子的關(guān)系
K近鄰分類器是一種簡(jiǎn)單且理論相對(duì)成熟的機(jī)器學(xué)習(xí)算法?;贙近鄰的面向?qū)ο蠓诸惖脑硎荹17]:首先選擇合適的特征量構(gòu)成最近鄰分類特征空間;其次計(jì)算目標(biāo)對(duì)象與所有訓(xùn)練樣本的特征距離,并統(tǒng)計(jì)前K個(gè)近鄰中屬于各類別的樣本個(gè)數(shù);若K近鄰中屬于第i類的樣本個(gè)數(shù)最多,則判斷未分類對(duì)象屬于第i類,若K近鄰中屬于第j類、第k類(j≠k)的樣本一樣多,且比其他類別的樣本數(shù)多,則比較未分類對(duì)象到第j類、第k類的平均距離;將未分類對(duì)象分到平均距離較小的那一類。當(dāng)K值為1時(shí)即為最近鄰分類。
在特征量的選取過程中,特征的選擇如果過少,會(huì)降低分類的精度;過多的冗余特征也會(huì)增加計(jì)算機(jī)運(yùn)行負(fù)擔(dān)從而容易造成“Hughes”現(xiàn)象。因此,有必要進(jìn)行特征空間優(yōu)化,找到類別之間區(qū)分的最大平均最小距離的特征組合,作為分類的最優(yōu)特征集,從而避免分類過程中盲目使用多種特征所導(dǎo)致的計(jì)算量急劇增大、分類精度低等問題。圖3顯示了隨著特征維數(shù)的變化,樣本之間的區(qū)分距離的變化。可以看出,當(dāng)特征維數(shù)較少即只有5或10個(gè)時(shí),增加特征量,區(qū)分距離增大;當(dāng)特征維數(shù)達(dá)到15個(gè)后,區(qū)分距離開始下降,表明過多的特征量已經(jīng)影響到分類的準(zhǔn)確性。
圖3 特征量維數(shù)與區(qū)分距離的關(guān)系
通過不斷選取特征量組合個(gè)數(shù),當(dāng)特征維數(shù)為15時(shí),區(qū)分距離達(dá)到最大,類別區(qū)分距離矩陣如表1所示。
表1 類別區(qū)分距離矩陣
最終選取的光譜特征量為歸一化差異水體指數(shù)(Normalized Difference Water Index,NDWI)、歸一化差異植被指數(shù)(Normalized Difference Vegetation Index,NDVI)、歸一化差異建筑指數(shù)(Normalized Difference Vegetation Index,NDBI)、紅邊歸一化植被指數(shù)(Red Edge Normalized Difference Vegetation Index,NDVI705),綠光、紅光、近紅外、紅邊第五、第六波段的亮度均值;紅邊第六波段、短波紅外第十二波段亮度的標(biāo)準(zhǔn)差。幾何特征為Roundness、Shape index、Density、Asymmetry。具體描述如表2所示。其中光譜特征描述中,ρNIR為近紅外波段的反射率;ρR為紅光波段的反射率;ρG為綠光波段的反射率;ρSWIR1為短波紅外波段的反射率;ρ750為高光譜波段中心波長(zhǎng)為750 nm波段的反射率;ρ705為高光譜波段中心波長(zhǎng)為705 nm波段的反射率。
表2 面向?qū)ο蟮墓庾V特征和幾何特征描述
面向?qū)ο蟮姆诸愂窃趀Cognition9.0中進(jìn)行的,面向像元的分類是在ENVI5.3中執(zhí)行的。四種方法的分類結(jié)果如圖4所示。在研究區(qū)范圍利用隨機(jī)函數(shù)生成200個(gè)點(diǎn)作為分類精度評(píng)估樣本點(diǎn),結(jié)合高分影像目視判讀和實(shí)地調(diào)查等方式解譯出樣本點(diǎn)的地物類型,分別計(jì)算基于面向?qū)ο蠓椒ê捅O(jiān)督分類方法的混淆矩陣,并計(jì)算生產(chǎn)者精度、用戶精度、總體精度和Kappa系數(shù)。四種分類方法的精度評(píng)估如表3所示。
表3 分類結(jié)果精度 單位:%
圖4 四種方法分類結(jié)果
面向?qū)ο蟮姆诸惙ǖ目傮w精度與Kappa系數(shù)比其他監(jiān)督分類方法都要高,總體精度達(dá)到了88.90%,Kappa系數(shù)為0.857 9,其他三類NN、SVM、MLC的總體精度分別為87.92%、85.57%、82.69%,Kappa系數(shù)分別為0.849 5、0.828 1、0.781 6。四種方法對(duì)于水體的分類精度都比較高,對(duì)于耕地和建筑用地,面向?qū)ο蠓诸惙ㄓ兄玫姆诸愋Ч?。三種傳統(tǒng)的監(jiān)督分類結(jié)果顯示,耕地與林草混分、建筑用地和道路的混分現(xiàn)象比較嚴(yán)重,導(dǎo)致這四類的用戶精度都不是很高。最大似然法在區(qū)分道路的效果上比SVM、NN要好;SVM中的道路、裸地的制圖精度較低,表明類別的漏分現(xiàn)象嚴(yán)重。NN中裸地的用戶精度最低,因?yàn)椴糠致愕乇换旆譃榱植莼蚪ㄖ玫亍?/p>
本文利用Sentinel-2數(shù)據(jù)對(duì)合肥市包河區(qū)進(jìn)行了土地利用的分類。首先選擇合適的參數(shù),利用多尺度分割技術(shù)對(duì)預(yù)處理后的影像進(jìn)行分割,獲取分割后的影像對(duì)象單元;然后采用面向?qū)ο笾械淖罱彿诸惼?并進(jìn)行特征空間的優(yōu)化與選擇;最后通過與三種面向像元的監(jiān)督分類法:最大似然分類、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)進(jìn)行比較,結(jié)果表明:
(1)面向?qū)ο蟮挠跋穹治黾夹g(shù)利用了局部到整體的分析思想,將具有同質(zhì)性的像元合并為影像對(duì)象,運(yùn)用各類特征對(duì)對(duì)象進(jìn)行整體分析,對(duì)于土地利用的分類、覆被信息的變化監(jiān)測(cè)研究具有重要意義。
(2)面向?qū)ο蟮挠跋穹治黾夹g(shù)在改善錯(cuò)分、漏分現(xiàn)象的同時(shí),也較好地減少了監(jiān)督分類出現(xiàn)的“椒鹽”現(xiàn)象,在四種分類算法中精度最高,分類效果最好。
今后的研究可以側(cè)重于兩個(gè)方面,一是深入研究最佳分割尺度參數(shù)的選擇方法;二是特征量的選擇上沒有考慮紋理特征和上下文特征,在加入更多的特征后,如何合理地量化特征量的選取過程亟待進(jìn)一步研究。