許 飛,曹 鑫,2,陳學(xué)泓,2,崔喜紅,2
(1. 北京師范大學(xué) 地表過程與資源生態(tài)國家重點實驗室,北京 100875;2. 北京師范大學(xué)地理科學(xué)學(xué)部遙感科學(xué)與工程研究院,北京 100875)
高空間分辨率遙感影像提高了遙感技術(shù)監(jiān)測地面信息的精細程度,被廣泛應(yīng)用于城市規(guī)劃、土地資源調(diào)查等領(lǐng)域。然而,受光照條件、地形起伏等因素影響,高空間分辨率使遙感影像在監(jiān)測同一地表覆蓋類型時出現(xiàn)嚴重的光譜變異性,即“椒鹽效應(yīng)”(salt-andpepper effect)[1]。當使用基于像元的分類方法處理高空間分辨率遙感影像時,這種“椒鹽效應(yīng)”會使高分影像中同一種地表覆蓋類型的分類結(jié)果出現(xiàn)誤分,降低了分類方法提取地面目標的精度。影像分割算法是一種解決“椒鹽效應(yīng)”的圖像處理算法,該方法對遙感影像的像元分割為若干個分割體,每個分割體內(nèi)的像元均為同質(zhì)性像元[2]。通過后續(xù)的分類、目標識別等影像處理過程,分割體可以被轉(zhuǎn)換為具有特殊語義的對象[3]。在分割算法中,分割尺度決定了分割體容納同質(zhì)像元的能力,當分割尺度越大時,分割體內(nèi)部像元的同質(zhì)性越低,分割體的面積越大;當分割尺度越小時,分割體內(nèi)部像元的同質(zhì)性越高,分割體的面積越小。過小的分割尺度會使分割體無法容納地面物體類內(nèi)的光譜變異性,即無法克服“椒鹽效應(yīng)”的影響;過大的分割尺度會使分割體不但能容忍地面物體類內(nèi)的光譜變異性,也能夠容忍地物類間的變異性,導(dǎo)致分割體內(nèi)部包含不同類別的像元,遺漏具有較小分割尺度的地面物體。因此,當影像分割算法被用于處理高空間分辨率遙感影像時,選擇分割尺度是一個非常重要的問題。
目前,遙感影像的分割算法包括單一尺度的分割方法[4-6]和多尺度分割算法[1-2,7]。其中,單一尺度的分割方法不適用于地表覆蓋條件復(fù)雜的遙感影像。在遙感影像中,不同類型的地面物體具有不同的物理空間尺度,因此,在遙感影像分割時,單一分割尺度無法同時刻畫所有類型的地面物體。相反,多尺度分割允許同一幅遙感影像被不同大小的分割尺度分割,相比之下多尺度分割更具有實用性。此外,在處理高空間分辨率遙感影像的工作中,eCognition?[8]是一種被廣泛使用的影像處理平臺,該軟件可以實現(xiàn)以多種尺度分割遙感影像的功能。
針對從多尺度影像分割中尋找影像中各種地物目標的最優(yōu)尺度問題,本文提出了一種基于后驗概率信息熵的多尺度分割組合算法MOCA(Multi-scalesegmentation Optimal Composition Algorithm)。該算法使用eCognition?對高空間分辨率遙感影像在多個尺度下進行分割,以分割體為單位計算不同分割尺度下高空間分辨率遙感影像內(nèi)每個分割體的平均光譜?;诓煌指畛叨认路指铙w的平均光譜,通過選取目標類型訓(xùn)練樣本,使用分類器(本文中為支持向量機SVM[9])生成不同分割尺度下的目標類型的后驗概率,并計算不同分割尺度下的后驗概率信息熵。最后,利用相鄰分割尺度下信息熵指標的最大差分值尋找每個地面物體的最優(yōu)分割尺度。本文使用F指標(Fmeasure)和BCI(Bidirectional Consistency Index)兩種指標評估地面目標物提取精度,并將MOCA與同類多尺度分割方法進行比較。本文提出的MOCA算法試圖實現(xiàn)多個分割尺度的最優(yōu)組合,以期獲得較高的地面目標物提取精度。
本文提出了一種多尺度分割優(yōu)化組合方法MOCA,其基本過程包括計算像元級后驗概率矢量、遙感影像的多尺度分割、計算不同分割尺度分割體的后驗概率信息熵、建立后驗概率信息熵最大差分指標、逐對象選擇最優(yōu)分割尺度。
1)計算像元級后驗概率矢量以及對高分影像進行多尺度分割
本文提出的方法需要計算多尺度分割結(jié)果中每個分割體的后驗概率矢量。首先,本文使用支持向量機(SVM)計算單個像元的后驗概率矢量。計算時,本文分別對樹木、草地、屋頂、道路和水體每種地表覆蓋類型選擇3000~5000個像元作為訓(xùn)練樣本,將訓(xùn)練樣本輸入至SVM分類器中得到像元級后驗概率矢量。與此同時,本文使用eCognition 8.9軟件對遙感影像進行多級尺度分割。分割時,形狀因子設(shè)置為0.2,緊致度因子設(shè)置為0.5。此外,影像的DN值的數(shù)量級決定了eCognition分割尺度的范圍。以HYDICE數(shù)據(jù)為例,本文以10為步長,從50遞增至1000,最終被選擇的多級分割尺度為50,60,70,80,…,970,980,990,1000。基于以上參數(shù),本文在eCognition 8.9軟件中利用MRS (multiresolution segmentation)算法創(chuàng)建規(guī)則集,生成高空間分辨率遙感影像在不同分割尺度下的分割結(jié)果。
然后,將eCognition生成的多尺度分割結(jié)果生成編號文件,以分割尺度為順序依次導(dǎo)出為柵格數(shù)據(jù),其中柵格數(shù)據(jù)中每個像素對應(yīng)的值就是該像元所在分割體的編號?;谏鲜霾襟E獲得的eCognition多尺度分割結(jié)果,以及像元級后驗概率矢量,可計算每一個分割尺度下各分割體的平均后驗概率矢量,最終得到每個地面物體在所有分割尺度的平均后驗概率。其中,對于某一分割尺度上的一個分割體而言,其后驗概率矢量可以表示如下:
2)建立后驗概率信息熵最大差分值指標
在不同分割尺度的分割結(jié)果中,總有一個面積最大的分割體Simax覆蓋地面物體i。隨著分割尺度的增加,不同類別的像元融入Simax,導(dǎo)致Simax的平均后驗概率矢量隨著分割尺度的增加發(fā)生變化。后驗概率信息熵[10]能夠?qū)⒎指铙w的后驗概率矢量轉(zhuǎn)換為分割體的類別純凈度指標;Simax的后驗概率信息熵隨著分割尺度的變化信息也能夠代表Simax內(nèi)部像元純凈度的變化。
本文對所有地面物體的Smax按照分割尺度的遞增順序分別計算其后驗概率信息熵。后驗概率信息熵的計算方法如下:
式中,Pi表示分割體屬于第i類的后驗概率,n代表總類別個數(shù)。當分割體處于過分割時(即分割尺度較小時),分割體內(nèi)所包含的類別單一,后驗概率信息熵值較??;當分割體處于低分割(即分割尺度較大時),分割體內(nèi)包含的類別豐富,后驗概率信息熵值較大。隨著分割體在不同尺度下形狀大小的變化,分割體的后驗概率信息熵也發(fā)生變化。分割尺度的增減直接影響分割體內(nèi)部像元類別多樣性的變化,因此,地面物體分割尺度的變化等價于地面物體所在分割體的后驗概率的變化。為了進一步探究后驗概率對信息熵指標的影響,本文假設(shè)兩種地表覆蓋類別的情況(兩種地表覆蓋的后驗概率分別為P1和P2),其中P1為目標地物真實類別的后驗概率,P0為目標地物周圍其他類別的后驗概率,信息熵的變化可以表達如下:
式中,Ei代表在第i分割尺度下分割體的后驗概率信息熵,1代表第i分割尺度和第i+1分割尺度的分割體的后驗概率差分值。
本文通過eCognition生成高空間分辨率遙感影像在50,60,70,…,980,990,1000分割尺度下的分割結(jié)果,通過前文所述的計算過程得到這些分割尺度下的后驗概率信息熵序列 。本文基于公式(4)計算出每一個地面物體在不同的相鄰分割尺度下的后驗概率信息熵序列,并找到|△E|i,i+1最大的分割尺度作為當前地面物體的最佳分割尺度,保存該物體在最佳分割尺度的分割體,最后合并遙感影像中所有地面物體的最佳分割體,形成多尺度分割結(jié)果。MOCA算法流程如圖1所示。
圖1 MOCA算法流程Fig.1 Flow chart of MOCA method
遙感影像分割結(jié)果的評判方法包括目視解譯法和定量判別法。在使用定量判別方法時,本文首先對研究區(qū)域的遙感影像進行手工數(shù)字化,生成地面物體的理想分割體,用于評價多尺度分割算法生成分割體的準確性。本文使用 BCI(Bidirectional Consistency Index)指標[11]和F指標(Fmeasure)[12]評價多尺度分割結(jié)果。F指標和BCI的計算公式如下:
式中,Si表示高空間分辨率遙感影像分割結(jié)果的第i個分割體,Simax表示Ri覆蓋區(qū)域的面積最大的分割體;Ri表示對應(yīng)于Si的參考分割體,Rimax表示Si覆蓋區(qū)域的面積最大的參考分割體。F指標和BCI的值越高,代表實驗生成的分割結(jié)果越符合地面物體的最優(yōu)分割結(jié)果。
本文使用了兩幅高空間分辨率遙感影像,其中一幅高分影像為華盛頓特區(qū)的HYDICE高空間分辨率高光譜影像,另一幅為北京地區(qū)的Quickbird高空間分辨率影像。如圖2所示,HYDICE和Quickbird高分影像中包括水體、道路、草坪、屋頂?shù)鹊孛嫖矬w。此外,HYDICE和Quickbird高空間分辨率遙感影像的過分割結(jié)果與低分割結(jié)果都無法恰當?shù)乜坍嬔芯繀^(qū)域的地面物體。度分割算法[13]以及MOCA算法對HYDICE影像和Quickbird影像進行分割,并使用F指標和BCI對每種方法生成的分割結(jié)果進行評估和對比。MOCA算法得到的分割尺度最優(yōu)組合結(jié)果如圖3所示,圖3中HYDICE數(shù)據(jù)與Quickbird數(shù)據(jù)的“參考分割結(jié)果”是手工數(shù)字化參考分割體;圖3的“MOCA分割結(jié)果”為本文算法得到的多尺度分割結(jié)果。為了體現(xiàn)MOCA能夠得到對象級的最優(yōu)分割尺度,圖3給出了HYDICE和Quickbird的分割尺度分布圖,其中每個分割體都具有不同的分割尺度。需要補充說明的是,由于道路和一些線狀分布的行道樹實際的物理尺度可能遠遠大于本文設(shè)定的分割尺度,為了更準確地對比不同方法的分割精度,本文在手工數(shù)字化參考分割體中剔除了道路和線狀分布的行道樹,只保留了雕像、屋頂、停車場、草坪、湖泊等地面物體。
圖2 HYDICE高光譜高空間分辨率遙感影像與Quickbird多光譜高空間分辨率遙感影像及其過分割與低分割結(jié)果Fig.2 High spatial resolution images of HYDICE and Quickbird, and the over-segmented and under-segmented results of HYDICE and Quickbird
圖3 MOCA算法最優(yōu)分割尺度組合結(jié)果Fig.3 Optimal multi-scale-segmentation composition results by MOCA
本文首先利用MOCA算法對HYDICE影像和Quickbird影像分別進行多尺度分割優(yōu)化組合,得到影像中每一個地面對象的分割體,利用F指標和BCI對算法生成分割體的準確性進行定量評價,并對比了單一尺度分割算法和穩(wěn)定區(qū)間多尺度分割算法[13]。然后,本文討論了eCognition多級分割尺度的步長與SVM分類器的訓(xùn)練樣本量對MOCA算法分割精度的影響。
3.2.1 分割結(jié)果及精度評價
本文分別使用單一尺度分割方法、穩(wěn)定區(qū)間多尺
根據(jù)圖3顯示的多尺度分割結(jié)果,可認為MOCA算法得到的分割結(jié)果與地面物體的理想分割體具有較高的吻合度。此外,本文使用F指標和BCI兩種指標定量評價了三種方法在同一區(qū)域的分割結(jié)果,定量評估結(jié)果見表1。通過定量對比實驗,本文得出MOCA算法比單一分割尺度、基于穩(wěn)定區(qū)間的多尺度分割算法具有更高的分割精度。
表1 定量評定結(jié)果Tab.1 Assessment of segmentation accuracy
3.2.2 參數(shù)敏感性分析
MOCA算法涉及兩個關(guān)鍵參數(shù),eCognition生成多級分割尺度分割結(jié)果的尺度步長、SVM分類器的訓(xùn)練樣本量。這兩種參數(shù)可能會對多尺度分割算法最終的分割精度產(chǎn)生影響,因此本文使用控制變量法,分別使用不同梯度的分割尺度步長和不同梯度的SVM分類器的訓(xùn)練樣本量對HYDICE數(shù)據(jù)進行分割,并統(tǒng)計不同輸入?yún)?shù)下的分割精度。參數(shù)變化對分割結(jié)果的影響見表2。
表2 參數(shù)變化對分割精度的影響Tab.2 The impact of parameters on accuracy of segmentation
本文根據(jù)表2得出以下結(jié)論:MOCA算法對eCognition分割尺度步長的變化敏感性較低,eCognition分割尺度步長越小,該算法得出的分割精度越高;SVM分類器的訓(xùn)練樣本量對本文算法分割精度具有較強的敏感性,當每種地表覆蓋類型的訓(xùn)練樣本量為5 000個像元時,本文算法的分割精度最高。
本文針對高空間分辨率遙感影像設(shè)計了一種基于后驗概率信息熵的多尺度分割優(yōu)化組合算法MOCA。通過華盛頓地區(qū)的HYDICE高光譜高空間分辨率遙感影像和北京地區(qū)QuickBird多光譜影像進行實驗,對分割結(jié)果的目視判別和定量評估,表明MOCA能夠同時適用于高光譜和多光譜高空間分辨率遙感影像的分割工作,并且能得到相對較好的分割精度。此外,本文對該算法涉及到的兩種參數(shù)進行了精度敏感性實驗,證明了該算法對eCognition多尺度分割步長不敏感,當SVM分類器訓(xùn)練樣本量為5000時該算法能得到最高的分類精度。