毛寧, 劉慧平, 劉湘平, 張洋華
(1.北京師范大學(xué)環(huán)境遙感與數(shù)字城市北京市重點實驗室,北京 100875; 2.北京師范大學(xué)地理科學(xué)學(xué)部地理學(xué)院,北京 100875)
隨著遙感技術(shù)的不斷發(fā)展,高空間分辨率遙感影像層出不窮。面向?qū)ο蟮挠跋穹指罘椒ㄒ殉蔀楦呖臻g分辨率影像信息提取的重要手段。但是,目前面向?qū)ο蟮挠跋穹指畲蠖嘣O(shè)定一個統(tǒng)一的分割尺度,對不同面積的地物易造成“過分割”和“欠分割”問題[1]。多尺度分割方法可以獲得更全面的地物目標(biāo)特征,逐漸成為研究熱點。
針對多尺度分割最優(yōu)尺度的選取,除依靠經(jīng)驗并結(jié)合目視選擇最優(yōu)分割尺度外,一些學(xué)者在通過統(tǒng)計計算確定最優(yōu)尺度方面也開展了許多工作。Espindola等[2]利用影像對象的光譜標(biāo)準(zhǔn)差和Moran’s I指數(shù),構(gòu)建優(yōu)度函數(shù)進(jìn)行最優(yōu)尺度選?。?Woodcock等[3]利用對象的均值方差選取最優(yōu)尺度,認(rèn)為當(dāng)影像分割對象的均值方差達(dá)到最大時,影像層中的純對象最多,其所對應(yīng)的分割尺度最優(yōu),但當(dāng)存在過分割時均值方差也可能很大; 張俊等[4]提出用對象標(biāo)準(zhǔn)差和對象與鄰域均值差分絕對值作為指標(biāo),構(gòu)建函數(shù)模型選取最優(yōu)分割尺度; 黃慧萍等[5]運(yùn)用統(tǒng)計學(xué)方法,確定最大面積與分割尺度的關(guān)系,結(jié)合目視確定不同地物的最優(yōu)分割尺度。目前已有的最優(yōu)分割尺度選取方法大多數(shù)采用方差或標(biāo)準(zhǔn)差作為對象內(nèi)部同質(zhì)性的指標(biāo),只考慮對象的光譜統(tǒng)計特性,對于對象的空間分布特性考慮不足[6],沒有充分利用高空間分辨率影像的特征,且方差和標(biāo)準(zhǔn)差不能很好地評價對象的同質(zhì)性[7]; 用Moran’s I指數(shù)作為異質(zhì)性指標(biāo),整個分割結(jié)果只得到一個異質(zhì)性指數(shù),忽略了局部對象與對象之間的異質(zhì)性,具有一定的片面性[8]。
高空間分辨率影像具有更豐富的地物結(jié)構(gòu)與形狀信息以及更清晰的紋理特征[5]。已有研究表明,將紋理特征應(yīng)用于高空間分辨率影像分割以及分類中可以顯著提高分割效果和分類精度。Coburn等[9]將本湖影像的紋理信息參與分割和分類,林分的提取效果得到很大改善,分類精度最高提高了40%; Kim等[10]對超高分辨率影像進(jìn)行面向?qū)ο蠓治?,對比了單尺度與多尺度分割結(jié)果以及有無紋理特征對分割及分類結(jié)果的影響,結(jié)果表明輔助紋理特征角二階矩陣和信息熵等的多尺度分割總精度比單尺度高6%,闡明了紋理的重要性; 林雪等[11]利用GF-1影像的多尺度紋理特征進(jìn)行面向?qū)ο蠓诸悾砻鹘Y(jié)合紋理特征能更有效地提取地物信息,且紋理特征中的均值、協(xié)同性和信息熵等均能提高分割效果和分類精度。目前,應(yīng)用紋理特征進(jìn)行影像分割和分類較多,但在最優(yōu)分割尺度選取方面應(yīng)用信息熵和角二階矩陣等灰度共生矩陣特征的較少。
針對上述情況,本研究提出用對象的紋理信息熵評價對象內(nèi)部同質(zhì)性,用與鄰域均值差分絕對值評價對象之間的異質(zhì)性,簡稱RMNE(the ratio of mean difference to neighbors(Abs)to entropy)方法,以2016年北京市位于城市邊緣的研究區(qū)為例,基于6 m空間分辨率的SPOT6影像,采用面向?qū)ο蟮亩喑叨确指罘椒ǎ肦MNE方法選取最優(yōu)分割尺度,并驗證該方法的有效性。
最優(yōu)分割尺度指的是分割后影像對象與地物目標(biāo)輪廓相當(dāng),大小接近,對象多邊形既不能太破碎,也不能邊界模糊,且光譜變異情況較小,影像對象內(nèi)部同質(zhì)性盡量高,不同類別對象之間的異質(zhì)性盡量大。本研究依據(jù)此原則,利用紋理特征信息熵評價對象內(nèi)部一致性,光譜特征與鄰域均值差分絕對值評價對象外部差異性,構(gòu)造RMNE指標(biāo)進(jìn)行最優(yōu)分割尺度選取。通過多尺度的RMNE變化曲線確定最優(yōu)尺度,并與目前常用的最大面積法和優(yōu)度函數(shù)法對比,評價RMNE方法的有效性?;赗MNE方法的多尺度分割最優(yōu)分割尺度選取流程如圖1所示。
圖1 研究流程
多尺度分割算法的目標(biāo)是在指定的與感興趣的地物目標(biāo)或空間結(jié)構(gòu)特征相對應(yīng)的尺度下,將影像分割成高同質(zhì)的、互相連接的不同影像區(qū)域,與感興趣的地物目標(biāo)或空間結(jié)構(gòu)特征相對應(yīng)[12]。本研究運(yùn)用eCognition8.7平臺的多尺度分割技術(shù),從像元開始,采用區(qū)域合并方法形成尺度(面積)不等的對象。相鄰影像區(qū)域兩兩合并增長,合并的判斷依據(jù)由相鄰對象的異質(zhì)性表達(dá)式值即閾值來決定。閾值可以看作是尺度參數(shù)[13]。該尺度參數(shù)的選取決定了圖像分割停止的條件。若尺度參數(shù)過小,容易產(chǎn)生過分割現(xiàn)象,使同一地物被分割成多個對象; 而尺度過大,則容易產(chǎn)生欠分割現(xiàn)象,因此,分割尺度參數(shù)的選取成為影響圖像分類精度的重要因子[14]。
1.2.1 對象內(nèi)部紋理信息熵
紋理特征能有效描述像元在空間上的排列、方向和組合方式[15]。與常用的圖像特征相比,更好地兼顧了圖像內(nèi)在的組成結(jié)構(gòu)。已有研究表明,紋理特征的參與提高了影像分割效果和分類結(jié)果[11,15]。紋理信息熵可以揭示對象內(nèi)部空間分布上的復(fù)雜程度,故本研究采用對象的紋理信息熵衡量對象內(nèi)部同質(zhì)性,計算公式為
(1)
式中:ENT為對象紋理信息熵值;P(i,j)為灰度共生矩陣中第i行第j列處的概率值;N為灰度共生矩陣的行列數(shù)。
計算每一影像對象層的對象信息熵的平均值,作為該層的同質(zhì)性指數(shù),以此得到所有影像對象層的同質(zhì)性指數(shù)。
為了消除量綱影響,將所得不同影像對象層的信息熵平均值進(jìn)行歸一化處理,取值范圍為[0,1],即
(2)
式中:ENTmax和ENTmin分別為不同分割尺度對象層的信息熵平均值的最大值和最小值;F(ENT)為對象信息熵歸一化后的值,F(xiàn)(ENT)越接近1,表示對象內(nèi)部分布越復(fù)雜,即對象同質(zhì)性越低;F(ENT)越接近0,表示對象內(nèi)部分布越均一,即對象同質(zhì)性越高。
1.2.2 對象之間異質(zhì)性指數(shù)
對象與鄰域均值差分絕對值可以揭示對象與每個分割層相鄰影像對象的離散情況,由對象的光譜特征計算得到,計算公式為
(3)
計算每一影像對象層的對象ΔCL平均值,作為該層影像對象層的異質(zhì)性指數(shù),以此得到所有影像對象層的異質(zhì)性指數(shù)。
已有研究表明該指數(shù)可以很好地揭示對象與對象之間的異質(zhì)性[7]。為了消除量綱影響,同樣將所得不同影像對象層的ΔCL平均值進(jìn)行歸一化處理,取值范圍為[0,1],計算公式為
(4)
式中:ΔCLmax和ΔCLmin分別為不同分割尺度對象層的對象與鄰域均值差分絕對值的平均值的最大值和最小值;F(ΔCL)為對象與鄰域均值差分絕對值歸一化后的值。F(ΔCL)越接近1,表示相鄰對象之間越離散,即對象之間異質(zhì)性越高;F(ΔCL)越接近0,表示相鄰對象之間越依賴,即對象異質(zhì)性越低。
1.2.3 RMNE
基于最優(yōu)分割尺度原則,采用基于紋理的信息熵來評價對象內(nèi)部同質(zhì)性,與鄰域均值差分絕對值來評價對象之間的異質(zhì)性,由于合適的分割參數(shù)選擇應(yīng)該是結(jié)合了低的信息熵(即對象內(nèi)部同質(zhì)好)和高的與鄰域均值差分絕對值(即對象之間異質(zhì)性好),故本文將上述2個歸一化后的值相除構(gòu)建分割評價函數(shù)RMNE,計算公式為
(5)
RMNE值越大,代表該尺度得到的對象內(nèi)部具有越高的同質(zhì)性,對象之間具有越高的異質(zhì)性。
1.2.4 最優(yōu)分割尺度選取
在分割實驗中,當(dāng)分割尺度小于某種地物類別目標(biāo)時,對象內(nèi)含有相同的地物類別,對象信息熵較小,相鄰對象之間屬于同一個類別,從而具有空間相關(guān)性,離散程度較小,對象與鄰域均值差分絕對值較小,故RMNE值較小; 當(dāng)分割尺度大小等于某種類別目標(biāo)時,對象內(nèi)含有相同的地物類別,F(xiàn)(ENT)最小,相鄰對象屬于不同的類別目標(biāo),離散程度最大,F(xiàn)(ΔCL)最大,故RMNE值最大; 當(dāng)分割尺度進(jìn)一步增大時,對象內(nèi)都會含有不同的地物類別,F(xiàn)(ENT)增大,與相鄰對象之間的離散程度開始逐漸降低,F(xiàn)(ΔCL)減小,故RMNE值也開始減小。
綜上,隨著分割尺度的變化,RMNE值呈現(xiàn)由小到大再變小的波動過程,故多尺度分割的RMNE變化曲線的極值所對應(yīng)的尺度就是最優(yōu)分割尺度。因此,影像分割的最優(yōu)尺度可以通過影像對象的RMNE值曲線來選擇,結(jié)合目視判讀或參考數(shù)據(jù)即可確定不同地物的最優(yōu)分割尺度。
選取北京市朝陽區(qū)與順義區(qū)交界處一地類豐富的地區(qū)為研究區(qū),以檢驗本文方法的有效性(圖2)。研究區(qū)內(nèi)包含部分順義中央別墅區(qū)、商業(yè)中心、道路、水體、草地和耕地等地物類型,總面積為90.63 km2。實驗數(shù)據(jù)為2016年5月16日獲取的6 m空間分辨率的SPOT6多光譜影像,含有藍(lán)光(B)、綠光(G)、紅光(R)和近紅外(NIR)4個波段; 選擇2016年6月14日的Google Earth影像作為實際地物參考影像。
圖2 研究區(qū)影像
在本研究中,將預(yù)處理(包括輻射校正、大氣校正等)后的SPOT6影像的4個波段作為圖像分割的輸入波段,考慮到每個波段的信息都很豐富,所以將4個波段的權(quán)重都賦為1。根據(jù)經(jīng)驗,將實驗中的光譜因子和形狀因子權(quán)重分別設(shè)為0.7和0.3,緊致度因子和光滑度權(quán)重都設(shè)為0.5。在預(yù)實驗分割中,當(dāng)eCognition8.7軟件分割尺度參數(shù)設(shè)置為100時,整個研究區(qū)僅被分割為29個對象,對象內(nèi)部混雜,對象之間無明顯邊界,這樣的對象已不具備研究意義,所以本文將分割尺度參數(shù)上限設(shè)置為100。選擇分割尺度從10增至100,以10為步長的一系列尺度參數(shù)對研究區(qū)進(jìn)行預(yù)分割,計算分割后每個尺度下的RMNE值,進(jìn)而選取最優(yōu)分割尺度。
基于多尺度分割技術(shù)得到的不同尺度的影像對象,根據(jù)1.2節(jié)方法計算不同尺度的紋理信息熵值、與鄰域均值差分絕對值和RMNE值,結(jié)果分別如圖3所示。
(a) 信息熵(b) 與鄰域均值差分絕對值 (c) RMNE值
圖3 RMNE方法計算結(jié)果
Fig.3ResultofRMNEmethod
由圖3(a)可知,隨著分割尺度的增大,對象信息熵值呈現(xiàn)3段先增大再減小的波動上升趨勢,在分割尺度分別為30,60和80處形成3個極小值,當(dāng)分割尺度大于80時F(ENT)急劇上升; 由圖3(b)可知,隨著分割尺度的增大,對象與鄰域均值差分絕對值也呈現(xiàn)3段先增大再減小的波動趨勢,當(dāng)分割尺度分別為30,60和80時,對象與鄰域均值差分絕對值出現(xiàn)了3個極大值點,當(dāng)分割尺度大于80時F(ΔCL)迅速減小; 由圖3(c)可知,隨著分割尺度與地物類別目標(biāo)大小之間的變化, RMNE值同樣呈現(xiàn)先增大再減小的波動趨勢,形成3個極大值點,對應(yīng)的尺度分別為30,60和80。所以,由最優(yōu)分割尺度選取方法及圖3(c)可知,最優(yōu)分割尺度組合為30,60和80。結(jié)合目視判斷,尺度為30時,水體、道路、部分草地和水邊林地的邊界清晰,且能與其他相鄰地物區(qū)分開,但大面積的耕地、建筑用地被分割的過于破碎; 尺度為60時,部分草地、建筑用地、耕地以及林地邊界完整清晰,光譜差異較為顯著; 尺度為80時,大面積的建筑用地和耕地具有完整的形狀和邊界,且容易與周圍地物區(qū)分開。
為了驗證RMNE方法的有效性,分別采用最大面積法[5]和優(yōu)度函數(shù)法[2]選取最優(yōu)尺度,結(jié)果如圖4所示。
(a) 最大面積法 (b) 優(yōu)度函數(shù)法
由圖4(a)可知,最大面積法得到的最優(yōu)尺度區(qū)間分別為[20,30],[50,60]和[70,80],RMNE方法得到的最優(yōu)分割尺度分別為30,60和80,處于上述尺度區(qū)間內(nèi),表明用RMNE方法獲取最優(yōu)分割尺度是有效的。而且相比最大面積法,RMNE法可以確定一個明確的尺度,更有利于后續(xù)實驗。為了表明加入灰度共生矩陣的信息熵特征更有利于對高空間分辨率影像進(jìn)行最優(yōu)分割尺度選擇,本文又將RMNE法得到的結(jié)果與優(yōu)度函數(shù)法得到的結(jié)果進(jìn)行對比,由圖4(b)可以看出,優(yōu)度函數(shù)法得到的最優(yōu)分割尺度只有80。所以,僅用光譜特征來構(gòu)建優(yōu)度函數(shù)選取最優(yōu)分割尺度對高空間分辨率影像來說具有一定的局限性,而加入了紋理特征,可以更好地選取最優(yōu)分割尺度。通過與上述方法的對比分析可以發(fā)現(xiàn),RMNE方法可以更好地選取多尺度分割的最優(yōu)分割尺度。
由于RMNE方法得到的最優(yōu)分割尺度組合為30,60和80,優(yōu)度函數(shù)法為80,故按照這2種方法對應(yīng)的最優(yōu)分割尺度分別進(jìn)行多尺度分割,得到如圖5所示的分割結(jié)果。由圖5對比可知,與優(yōu)度函數(shù)法的分割結(jié)果相比,RMNE方法獲得的影像對象邊界與地物目標(biāo)輪廓更接近,大小相當(dāng)且與其他對象是可分的,具有更高的對象內(nèi)部同質(zhì)性以及對象間的異質(zhì)性。
(a) RMNE法 (b) 優(yōu)度函數(shù)法
為了對比RMNE方法和最大面積法的分割結(jié)果,取最大面積法得到的3個最優(yōu)分割尺度區(qū)間的中值(25,55和75)進(jìn)行多尺度分割。隨機(jī)選取2種方法分割得到的4塊不同地物類型(別墅、城鎮(zhèn)居民地、商業(yè)用地和耕地)的影像對象進(jìn)行對比,并以Google Earth影像作為參考,結(jié)果如圖6所示。
(a) 區(qū)域1RMNE法結(jié)果(b) 區(qū)域1最大面積法結(jié)果 (c) 區(qū)域1Google Earth影像
(d) 區(qū)域2RMNE法結(jié)果(e) 區(qū)域2最大面積法結(jié)果 (f) 區(qū)域2Google Earth影像
(g) 區(qū)域3RMNE法結(jié)果(h) 區(qū)域3最大面積法結(jié)果(i) 區(qū)域3Google Earth影像
(j) 區(qū)域4RMNE法結(jié)果 (k) 區(qū)域4最大面積法結(jié)果 (l) 區(qū)域4Google Earth影像
可以發(fā)現(xiàn)RMNE方法分割得到的結(jié)果可以更好地對應(yīng)實際地物對象,更具有地理意義,匹配度更高,故RMNE方法得到的最優(yōu)分割尺度更優(yōu)。
本文提出了一種多尺度分割的最優(yōu)分割尺度選取方法(RMNE),對研究區(qū)的SPOT6多光譜影像數(shù)據(jù)進(jìn)行多尺度分割,通過與Google Earth影像對比可知,分割得到的影像對象大小與地物實際大小較為相符,實驗結(jié)果驗證了RMNE方法的有效性,并得出以下結(jié)論:
1)利用RMNE方法得到研究區(qū)的最優(yōu)分割尺度組合為30,60和80,表明本文提出的采用對象的紋理信息熵和與鄰域均值差分絕對值評價對象的同質(zhì)性和異質(zhì)性是有效的,對高空間分辨率遙感影像是適用的。
2)與最大面積法和優(yōu)度函數(shù)法的結(jié)果進(jìn)行對比可知,RMNE方法的分割結(jié)果更符合地物的實際大小和形狀,具有明顯優(yōu)勢,所以紋理信息的加入更有利于多尺度分割的最優(yōu)分割尺度選擇。
但是,本文的分割尺度從10開始,以10為步長,增加到100,尺度范圍設(shè)置的略為寬泛。下一步將細(xì)化步長值,更精確地定位分割尺度。