劉 潤(rùn),張紹良,賈 蓉
(1. 中國(guó)礦業(yè)大學(xué)環(huán)境與測(cè)繪學(xué)院,江蘇 徐州 221116; 2. 江南大學(xué),江蘇 無錫 214122)
城市建筑物是城市最基本的元素,利用遙感技術(shù)快速、高精度提取城市建筑物信息是城市動(dòng)態(tài)監(jiān)測(cè)、數(shù)字城市和智慧城市建設(shè)的關(guān)鍵技術(shù)。
隨著高空間分辨率遙感技術(shù)的發(fā)展,傳統(tǒng)的基于像元的分類方法已經(jīng)無法滿足高精度建筑物提取的要求。但是,高分辨率遙感影像建筑物信息的高精度提取的計(jì)算和分析過程必須依賴更多的綜合地物的結(jié)構(gòu)、大小、形狀、分布等空間特征信息和語義信息[1-4]。國(guó)內(nèi)外很多學(xué)者都曾基于建筑物明顯的幾何結(jié)構(gòu)特征嘗試對(duì)建筑物信息進(jìn)行提取,如利用直線和角點(diǎn)特征[5-7],線段的空間關(guān)系特征[6]等。但該類方法多使用影像底層特征信息,嚴(yán)重依賴單一或少量特征,且算法復(fù)雜。為了更好地實(shí)現(xiàn)光譜信息、紋理信息等更多特征信息的綜合應(yīng)用,學(xué)者又嘗試了新的識(shí)別方法,如Baatz和Schape等利用多尺度區(qū)域分割結(jié)合決策樹分類的方法,通過綜合地物的光譜信息,紋理信息和上下文信息來檢測(cè)建筑物,實(shí)現(xiàn)了建筑物屋頂?shù)奶崛8];呂鳳華等提出了一種基于多層次特征的航空影像規(guī)則建筑物提取方法,即先利用大尺度特征,如方向梯度直方圖對(duì)建筑物進(jìn)行粗識(shí)別,然后利用小尺度特征如光譜和紋理的特點(diǎn)對(duì)粗提取結(jié)果進(jìn)行篩選,最后通過試驗(yàn)提取表明該方法對(duì)規(guī)則建筑物的提取效果較好,一些復(fù)雜建筑物的提取也很理想[9];周紹光等利用角度紋理特征和光譜特征構(gòu)造特征矢量,利用圖割法獲取建筑物候選點(diǎn),經(jīng)數(shù)學(xué)形態(tài)學(xué)處理得到建筑物斑塊,最后通過試驗(yàn)證明了該方法的可行性[10]。綜合使用建筑物光譜、形狀及紋理等特征可以提高建筑物提取精度,但過多的特征信息往往也會(huì)造成特征冗余,且大量信息的計(jì)算分析往往也比較耗時(shí)且對(duì)計(jì)算機(jī)硬件要求較高。
鑒于此,本文以Pleiades衛(wèi)星影像建筑物信息提取為例,研究利用改進(jìn)型Relief F算法進(jìn)行特征篩選來減少冗余特征,實(shí)現(xiàn)最優(yōu)特征組合構(gòu)建,從而提高建筑物信息提取效率和提取精度。
Kira和Rendell于1992年提出Relief算法,它是一種多參量過濾式特征篩選方法,通過統(tǒng)計(jì)樣本之間的距離來選取參與權(quán)重計(jì)算的鄰近樣本[11]。其在計(jì)算距離過程中,相關(guān)特征會(huì)影響樣本的相對(duì)距離進(jìn)而影響鄰近樣本選擇,從而為特征權(quán)重計(jì)算提供理論依據(jù)[12]。特征降維通過對(duì)樣本進(jìn)行迭代計(jì)算,篩選出權(quán)重最大的特征組成特征集合而實(shí)現(xiàn)。特征權(quán)重更新方法如下
wi=wi-xi-Mi(x) +xi-Hi(x)
(1)
H(x)和M(x)分別是與x的同類和非同類的最近鄰點(diǎn)。根據(jù)Relief算法將樣本特征按照分類能力大小進(jìn)行排序,然后通過設(shè)置閾值篩選出最優(yōu)特征。然而Relief有其固有的弱項(xiàng),由于高分遙感影像中存在干擾噪聲,單一選取最近最遠(yuǎn)樣本計(jì)算特征權(quán)重不能保證精度,又由于樣本大小,計(jì)算難度限制了全樣本計(jì)算,因此選取合適的簡(jiǎn)化算法來優(yōu)化Relief算法成為保持其穩(wěn)健性的最佳選擇。Relief F方法是一種較為常見的改進(jìn)方法,相較于Relief算法,取值選擇為K個(gè)樣本,數(shù)目為較少的一類樣本數(shù)目的一半[13]。
Relief F作為一種具有較強(qiáng)區(qū)分度的方法,其由于缺失冗余處理過程,特征間具有高度相關(guān)性。故對(duì)原算法進(jìn)行改進(jìn),增加冗余處理決策修改為Relief FT(relief fund threshold)。通過特征權(quán)重至限制特性之間的相關(guān)性處理,對(duì)特征進(jìn)行進(jìn)一步篩選,若經(jīng)過閾值篩選后仍有多個(gè)特征存在,則保留特征權(quán)重值最大的特征。Relief FT的數(shù)學(xué)表達(dá)為
(2)
(3)
Relief FT算法的實(shí)現(xiàn)步驟為:
輸入:訓(xùn)練樣本集合D,迭代次數(shù)r,最近鄰樣本個(gè)數(shù)d,閾值為m,特征選擇集合A。
輸出:預(yù)測(cè)的特征權(quán)值向量w0,初始化特征權(quán)值向量w0。
Fori=1 tor;
(1) 從D中隨機(jī)選擇實(shí)例Si。
(2) 計(jì)算d個(gè)同類最近鄰實(shí)例xj(j=1,2,…,k)。
(3) 從與Si不同類的實(shí)例中選出d個(gè)最近鄰實(shí)例Mj(C)(C≠class(Si))。
(4) fori=1 to all attributes(對(duì)每個(gè)特征,用式(2)更新權(quán)值,式中,c為類別;P(c)為c類目標(biāo)樣本占樣本總數(shù)的比例)。
(5)wi (6) 運(yùn)算結(jié)束。 樣本間距離difft,si,x計(jì)算采用馬氏距離法,分別從類間和類內(nèi)考察特征區(qū)分樣本的能力。由上式可知,樣本特征是否有利于分類,可以通過比較樣本之間的距離diff來判斷,具體原則為:同類樣本距離越小,不同類樣本距離越大,則特征為最優(yōu)特征,即有利于分類。 本研究選用的數(shù)據(jù)為法國(guó)Astrium公司Pleiades衛(wèi)星所獲取的高分辨率遙感影像,Pleiades衛(wèi)星是SPOT星族的后續(xù)衛(wèi)星。由Pleiades-1和Pleiades-2兩顆衛(wèi)星組成[14]。本文實(shí)驗(yàn)數(shù)據(jù)獲取時(shí)間為2012年10月5日,研究區(qū)位于某中學(xué),如圖1所示。其中包含一個(gè)0.5 m分辨率的全色波段(圖1(a))和一個(gè)2 m分辨率的4波段的多光譜(圖1(b))。 在進(jìn)行建筑物提取之前需要對(duì)原始影像進(jìn)行預(yù)處理。旨在減少影像幾何畸變,輻射誤差,如幾何校正、輻射校正。為了提高多光譜影像空間分辨率和地物細(xì)節(jié)特征,進(jìn)行了圖像融合和增強(qiáng)處理。在ENVI 4.8軟件的支持下,遙感影像預(yù)處理流程如圖2 所示。其中圖像融合方法采取主成分分析融合法,對(duì)比度增強(qiáng)采用分段線性變換。 圖1 原始遙感影像 特征空間構(gòu)建首先需要對(duì)圖像進(jìn)行分割,本文試驗(yàn)對(duì)影像由下而上進(jìn)行分割,為保證地物邊界異質(zhì)性,在底層影像分割時(shí)采取小尺度分割方法。綜合已有研究成果[15-16],根據(jù)建筑物在影像上的表征特點(diǎn),構(gòu)建基礎(chǔ)特征空間。特征主要分為三大類:光譜特征、形狀特征和紋理特征。其中光譜特征包含亮度、最大均值差、方差等;形狀特征包含面積、周長(zhǎng)、形狀復(fù)雜度等;紋理特征主要有標(biāo)準(zhǔn)差、熵等。建筑物基礎(chǔ)特征匯總見表1。 圖2 預(yù)處理流程 光譜特征形狀特征紋理特征波段(R/G/B/N)亮度、最大均值差、方差、比率、灰度最大值、灰度最小值面積、周長(zhǎng)、寬度、長(zhǎng)寬比、緊密度、對(duì)稱性、邊界平滑度、形狀復(fù)雜度對(duì)比度、同質(zhì)性、差異性、標(biāo)準(zhǔn)差、能量、熵 將選擇出來的特征以圖像為基礎(chǔ)數(shù)據(jù),以Relief FT算法為依據(jù),在圖像分割的基礎(chǔ)上,隨機(jī)選取建筑物和非建筑物各10個(gè)樣本,在Matlab環(huán)境下進(jìn)行操作。得到每個(gè)特征對(duì)應(yīng)權(quán)重及各特征權(quán)重分布情況,如圖3和表2所示。 圖3 各特征權(quán)重分布 權(quán)重0~100100~200200~300300~400>400分布/個(gè)1613441 根據(jù)圖3和表2可知,特征權(quán)重介于0~600之間,其中最大權(quán)重值所對(duì)應(yīng)的特征依次為相異性特征、面積特征和B波段亮度;權(quán)重最小值對(duì)應(yīng)的特征依次為長(zhǎng)寬比特征、G波段方差和寬度特征。根據(jù)權(quán)重最大篩選最優(yōu)特征原則說明,相異性特征、面積特征和B波段亮度均值能夠滿足建筑物提取要求。對(duì)于特征權(quán)重較小的長(zhǎng)寬比、G波段方差和寬度則不能很好地用于建筑物提取。在特征篩選結(jié)束后,將得到的有效特征代入樣本中進(jìn)行驗(yàn)證,這里以特征最大和最小權(quán)重為例,如圖4所示。 其中,前10個(gè)樣本選自建筑物,后10個(gè)樣本選自非建筑物。通過分析圖4(a)各樣本相關(guān)系數(shù)后發(fā)現(xiàn),建筑物10號(hào)樣本相關(guān)系數(shù)大于0.7,其他均小于0.7,非建筑物15號(hào)樣本相關(guān)系數(shù)小于0.8,其他均大于0.8。因此可將閾值區(qū)間設(shè)置為0.7—0.8。圖4(b)中建筑物樣本和非建筑物樣本之間并無明顯的分布規(guī)律,因此在這類特征中難以通過設(shè)置閾值達(dá)到提取建筑物的目的,并且無關(guān)特征參與計(jì)算在加大工作量的同時(shí)也會(huì)影響最終提取結(jié)果。綜上所述,本文設(shè)置權(quán)重閾值為300,相關(guān)系數(shù)閾值為0.9作為篩選特征的條件,經(jīng)過篩選,最終有5組特征滿足要求,分別為相異性特征、面積特征和B波段的亮度均值、方差和信息熵。 針對(duì)研究區(qū)影像,分別使用傳統(tǒng)基于像元的監(jiān)督分類、無特征篩選的決策規(guī)則分類和基于改進(jìn)型Relief F特征篩選的決策規(guī)則分類3種方法對(duì)研究區(qū)建筑物進(jìn)行檢測(cè)提取,其中監(jiān)督分類的分類算法使用支持向量機(jī)SVM。在初提取的基礎(chǔ)上,運(yùn)用形態(tài)學(xué)算法對(duì)提取結(jié)果進(jìn)行優(yōu)化處理,最后得到三者提取結(jié)果如圖5所示。 圖4 最大、最小權(quán)重特征驗(yàn)證結(jié)果 圖5 建筑物提取結(jié)果 通過比較3種分類方法結(jié)果圖可以發(fā)現(xiàn),相比其他兩種分類方法,使用監(jiān)督分類得到的結(jié)果中有大量地面不透水鋪裝,如建筑物前廣場(chǎng)、籃球場(chǎng)等被錯(cuò)分成了建筑物屋頂,這主要是由于該類不透水鋪裝材質(zhì)與建筑物屋頂材質(zhì)相似,導(dǎo)致遙感影像上兩類地物的光譜特征相似,因此難以將兩種地物區(qū)分開來;無特征篩選分類結(jié)果較監(jiān)督分類有所改善,但仍有不透水鋪裝被錯(cuò)分成建筑物屋頂;基于Relief F特征篩選的分類方法取得效果較好,大大減少了不透水鋪裝被錯(cuò)分成建筑物屋頂?shù)臄?shù)量。為進(jìn)一步驗(yàn)證這3種方法提取精度,通過人機(jī)交互式解譯方法選取32個(gè)建筑樣本點(diǎn),抽取建筑面積5860 m2作為精度驗(yàn)證參考數(shù)據(jù)。表3給出了最終精度驗(yàn)證結(jié)果。 從表3可以看出,監(jiān)督分類方法精確度只有57.3%,其生產(chǎn)精度和用戶精度也只有60.43%和61.34%,這說明傳統(tǒng)基于像元的分類方法并不適合高分辨率影像建筑物提?。欢硗鈨煞N基于特征的建筑物提取方法各項(xiàng)精度都能達(dá)到80%以上,明顯優(yōu)于監(jiān)督分類,這是由于大量特征的應(yīng)用可以模擬人工思維進(jìn)行信息選擇,因此可以提高分類精度。由于過多的特征也會(huì)導(dǎo)致誤判,因此特征篩選可以使最終分類精度進(jìn)一步得到提高。 表3 精度驗(yàn)證結(jié)果 本文以Pleiades高分辨率遙感影像為數(shù)據(jù)源構(gòu)建建筑物特征空間,使用Relief F特征篩選法進(jìn)行最優(yōu)特征篩選,利用最優(yōu)特征組合進(jìn)行建筑物提取,并與監(jiān)督分類法、無特征篩選建筑物提取法進(jìn)行對(duì)比。 試驗(yàn)證明,基于特征的建筑物提取方法要優(yōu)于監(jiān)督分類。而利用特征篩選過后的最優(yōu)特征組合進(jìn)行建筑物提取為3種方法中最優(yōu),且提取精度能夠滿足相關(guān)研究需要。本研究使用Relief F特征篩選方法,并未與其他篩選方法作對(duì)比。若條件允許,也可進(jìn)行特征篩選方法的對(duì)比研究。在數(shù)據(jù)源方面,也可借助其他輔助信息(如雷達(dá)數(shù)據(jù))進(jìn)一步提高建筑物提取精度。 [1] CHRISTODOULIDIS A,HURTUT T,TAHAR H B,et al.A Multi-scale Tensor Voting Approach for Small Retinal Vessel Segmentation in High Resolution Fundus Images[J].Computerized Medical Imaging and Graphics,2016,52(9):28-43. [2] 胡榮明,黃小兵,黃遠(yuǎn)程.增強(qiáng)形態(tài)學(xué)建筑物指數(shù)應(yīng)用于高分辨率遙感影像中建筑物提取[J].測(cè)繪學(xué)報(bào),2014,43(5):514-520. [3] 李朝奎,方文,董小姣.面向?qū)ο蠛鸵?guī)則的高分辨率影像分類研究[J].測(cè)繪通報(bào),2015(9):9-13,35. [4] 張慶云,趙冬.高空間分辨率遙感影像建筑物提取方法綜述[J].測(cè)繪與空間地理信息,2015(4):74-78. [5] NEVATIA R,LIN C,HUERTAS A.A System for Building Detection from Aerial Images[C]∥Proceeding of Automatic Extraction of Man-made Object from Aerial and Space image(Ⅱ).Basel:Brikhauser,1997:77-86. [6] HUERTAS A,NEVATIA R.Detecting Buildings in Aerial Images[J].Computer Vision,Graphics and Image Processing,1988,41(2):131-152. [7] 唐亮,謝維信,黃建軍,等.直線Snakes及其在建筑物提取中的應(yīng)用[J].西安電子科技大學(xué)學(xué)報(bào),2005,32(1):60-65. [8] BAATZ M,SCHAPE A.Object-oriented and Multi-scale Image Analysis in Semantic Networks[C]∥Proceedings of the 2nd International Symposium on Operationalization of Remote Sensing.Enschede:ITC,1999. [9] 呂鳳華,舒寧,龔颵,等.利用多特征進(jìn)行航空影像建筑物提取[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2017,42(5):656-660. [10] 周紹光,孫金彥,凡莉,等.高分辨率遙感影像的建筑物輪廓信息提取方法[J].國(guó)土資源遙感,2015,27(3):52-58. [11] KIRA K,RENDELL L.The Feature Selection Problem:Traditional Methods and a New Algorithm[C]∥Proceedings of the Ninth National Conference on Artificial Intelligence.New Orleans:AAAI Press,1992:129-134. [12] 李曉嵐.基于Relief特征選擇算法的研究與應(yīng)用[D].大連:大連理工大學(xué),2013. [13] KONONENKO I.Estimating Attributes:Analysis and Extension of Relief[J].Machine Learning,1994,784(4):171-182. [14] CHENG F,THIEL K H.Delimiting the Building Heights in a City from the Shadow in a Panchromatic SPOT-image—Part 1.Test of Forty-two Buildings[J].International Journal of Remote Sensing,1995,16(3):409-415. [15] 付卓.高分辨率遙感衛(wèi)星影像中城市人工地物提取方法研究[D].北京:北京交通大學(xué),2006. [16] 陶陽宇,梁林,徐迎慶,等.利用貝葉斯結(jié)構(gòu)模型的復(fù)雜形狀建筑物提取[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2010,22(4):647-653.2 結(jié)果與討論
2.1 影像簡(jiǎn)介及預(yù)處理
2.2 初始化特征空間構(gòu)建
2.3 特征篩選
2.4 建筑物信息提取
3 結(jié) 語