張旭 侯金元 葛嫻君
摘 要:本文提出了一種基于雙層上下文語(yǔ)義網(wǎng)的遙感郊外建筑物檢測(cè)方法。該方法主要包括以下兩個(gè)階段。第一階段:郊外大視場(chǎng)遙感圖像疑似區(qū)快速提取;第二階段:通過(guò)構(gòu)建雙層上下文語(yǔ)義分類(lèi)網(wǎng)對(duì)建筑物疑似區(qū)精準(zhǔn)鑒別。實(shí)驗(yàn)表明,本算法具備檢測(cè)精度高、虛警率低以及運(yùn)算效率高等優(yōu)點(diǎn)。
關(guān)鍵詞:遙感;建筑物檢測(cè);上下文;雙層語(yǔ)義網(wǎng)
Abstract: This paper proposed a remote sensing suburban building detection method based on double-layer context semantic network. This method mainly includes the following two stages. The first stage is the rapid extraction of suspected areas from remote sensing images with large field of view in suburbs; the second stage is the accurate identification of suspected areas of buildings by constructing a two-tier context semantic classification network. Experiments show that the algorithm has the advantages of high detection accuracy, low false alarm rate and high operational efficiency.
Keywords: remote sensing;building detection;context;bilevel semantic network
1 基于圖割理論的郊外大視場(chǎng)建筑物疑似區(qū)快速提取
1.1 基于圖論最優(yōu)二叉樹(shù)的郊外大視場(chǎng)粗分割
接著,判斷集合之間的相似關(guān)系,利用集合間相似度和集合內(nèi)部相似度進(jìn)行判斷,具體為:若兩個(gè)圖像區(qū)域相似度較高,則任一集合內(nèi)部的相似度小于集合之間的相似度,進(jìn)行合并;否則,進(jìn)行分離,具體標(biāo)準(zhǔn)為:
為區(qū)域像素個(gè)數(shù)總和的反比例關(guān)系式,表示區(qū)域的邊緣長(zhǎng)度與區(qū)域面積的比值。
1.2 基于建筑物幾何特征的疑似區(qū)虛警初步篩除
由于大視場(chǎng)的復(fù)雜性,初步分割得到的建筑疑似區(qū)中,存在大量的虛警,可利用建筑物幾何特征初步篩除疑似區(qū)虛警。本文采用建筑物疑似區(qū)長(zhǎng)寬比和矩形度的形狀特征進(jìn)行虛警剔除。
基于圖割理論的郊外大視場(chǎng)建筑物疑似區(qū)快速提取示意圖所示。
2 基于雙層語(yǔ)義分類(lèi)網(wǎng)的建筑疑似區(qū)精準(zhǔn)鑒別
遙感圖像中的郊外建筑物雖然屬于同類(lèi)遙感目標(biāo),但類(lèi)內(nèi)差異較大,影響鑒別的準(zhǔn)確性,需要對(duì)提取獲得疑似區(qū)的初級(jí)特征進(jìn)行中層語(yǔ)義描述才能有效鑒別。本文首先通過(guò)視覺(jué)詞袋對(duì)疑似區(qū)的局部描述子特征進(jìn)行中層語(yǔ)義描述,形成對(duì)典型建筑構(gòu)件的表征。接著,對(duì)中層語(yǔ)義特征的頻次分布進(jìn)行編碼,形成較為抽象的直方圖編碼特征,建立典型建筑構(gòu)件間的上下文聯(lián)系。
2.1 典型建筑構(gòu)件中層語(yǔ)義特征提取
將疑似區(qū)樣本集分為視覺(jué)單詞訓(xùn)練樣本集和特征編碼訓(xùn)練樣本集。對(duì)疑似區(qū)視覺(jué)單詞訓(xùn)練樣本集進(jìn)行SIFT特征提取,并由歐氏距離聚類(lèi)其視覺(jué)單詞,視覺(jué)單詞對(duì)應(yīng)建筑物典型構(gòu)件。具體為:對(duì)疑似區(qū)中每個(gè)關(guān)鍵點(diǎn)鄰域提取SIFT特征為描述特征,并以K-means聚類(lèi)為視覺(jué)單詞;接著,基于OC-SVM進(jìn)行視覺(jué)單詞判斷準(zhǔn)則的訓(xùn)練,獲得視覺(jué)單詞判斷準(zhǔn)則;然后,對(duì)每個(gè)疑似區(qū)樣本中的所有關(guān)鍵構(gòu)件進(jìn)行視覺(jué)單詞判別,并將判別結(jié)果按出現(xiàn)的頻次統(tǒng)計(jì)為視覺(jué)單詞直方圖,每個(gè)疑似區(qū)樣本對(duì)應(yīng)一個(gè)視覺(jué)單詞直方圖,具體步驟為如下。
2.1.1 局部描述子初級(jí)特征提取。本文采用SIFT[1]算法對(duì)建筑物疑似區(qū)切片進(jìn)行特征關(guān)鍵點(diǎn)提取。提取步驟包括:極值點(diǎn)檢測(cè)、關(guān)鍵點(diǎn)精確定位、關(guān)鍵點(diǎn)方向分配及局部描述子的生成。將提取到的建筑物疑似區(qū)的SIFT初級(jí)圖像特征,利用K-means聚類(lèi)的方法形成視覺(jué)單詞,選取k個(gè)聚類(lèi)中心,其中每一個(gè)聚類(lèi)的中心為一個(gè)視覺(jué)單詞。
2.1.2 建立基于OC-SVM的視覺(jué)單詞判斷準(zhǔn)則。為實(shí)現(xiàn)對(duì)樣本中關(guān)鍵點(diǎn)進(jìn)行典型構(gòu)件屬性的準(zhǔn)確判別,考慮到屬性類(lèi)別數(shù)k在不同場(chǎng)景應(yīng)用時(shí)構(gòu)件類(lèi)別會(huì)有增減,因此判別時(shí)選擇one-class SVM對(duì)每類(lèi)構(gòu)件屬性進(jìn)行判別?;诿總€(gè)關(guān)鍵點(diǎn)的局部描述子特征,利用one-class SVM建立訓(xùn)練準(zhǔn)則進(jìn)行判別。通過(guò)樣本訓(xùn)練得到OC-SVM決策函數(shù)為:
2.1.3 視覺(jué)單詞頻次直方圖構(gòu)建。對(duì)每個(gè)疑似區(qū)樣本中的所有關(guān)鍵點(diǎn)進(jìn)行局部描述子特征提取,并進(jìn)行視覺(jué)單詞屬性判別,則每個(gè)候選區(qū)的所有關(guān)鍵點(diǎn)將對(duì)應(yīng)得到表征典型構(gòu)件的中層BOW特征描述。接著,將目標(biāo)及對(duì)應(yīng)周域場(chǎng)景中的BOW特征分別利用對(duì)應(yīng)的視覺(jué)詞典表示為視覺(jué)詞匯,對(duì)每個(gè)視覺(jué)單詞出現(xiàn)的頻率構(gòu)成視覺(jué)單詞直方圖,提取得到的目標(biāo)視覺(jué)直方圖(維度為M),場(chǎng)景視覺(jué)直方圖為[hsen](維度為N),則對(duì)疑似區(qū)域的視覺(jué)直方圖可表示(。上述目標(biāo)多層次上下文信息統(tǒng)一融合編碼可以通過(guò)式(6)構(gòu)建:
上下文信息統(tǒng)一編碼[Hreg]包括多種不同層次的上下文,可以被分解為三類(lèi):目標(biāo)上下文直方圖、鄰域場(chǎng)景上下文直方圖以及目標(biāo)與周域場(chǎng)景間的上下文直方圖,就此完成中層特征編碼。
2.2 基于典型構(gòu)件中層語(yǔ)義特征的疑似區(qū)鑒別
2.2.1 疑似區(qū)中層語(yǔ)義特征的SVM分類(lèi)器構(gòu)造。對(duì)中層編碼訓(xùn)練樣本集中的每個(gè)建筑物疑似區(qū)樣本,按上述方法提取視覺(jué)單詞頻次直方圖特征,并利用多類(lèi)SVM分類(lèi)器進(jìn)行訓(xùn)練,形成郊外建筑物與三類(lèi)虛警的分類(lèi)判決準(zhǔn)則。其中,虛警目標(biāo)劃分為路田區(qū)域、復(fù)雜山脈區(qū)域和植被覆蓋區(qū)域。
2.2.2 基于雙層分類(lèi)網(wǎng)的疑似區(qū)鑒別。對(duì)待預(yù)測(cè)的疑似區(qū)樣本,經(jīng)過(guò)上述“基于圖割理論的郊外大視場(chǎng)建筑物疑似區(qū)快速提取”和“典型建筑構(gòu)件中層語(yǔ)義特征提取”兩個(gè)步驟,獲得預(yù)測(cè)樣本的視覺(jué)單詞頻次直方圖特征。接著,采用上一步獲得的疑似區(qū)多類(lèi)SVM判斷準(zhǔn)則進(jìn)行判別,獲得建筑物疑似區(qū)的鑒別及分類(lèi)結(jié)果。
3 實(shí)驗(yàn)
3.1 數(shù)據(jù)和評(píng)價(jià)方法
本文的實(shí)驗(yàn)數(shù)據(jù)集來(lái)自于Google Earth的北京周邊郊區(qū)的大視場(chǎng)遙感圖像,分辨率為1~2m,數(shù)據(jù)的像素大小為3 000×3 000到12 000×12 000。實(shí)驗(yàn)需要SVM訓(xùn)練樣本集,故將數(shù)據(jù)集中的200副樣本作為多分類(lèi)樣本集,其中要區(qū)分正負(fù)樣本種類(lèi),最后的測(cè)試集設(shè)定為150副,用來(lái)驗(yàn)證本方法的有效性。
本文所用編程平臺(tái)是MATLAB2016a,實(shí)驗(yàn)測(cè)試平臺(tái)為Intel 3.6G CPU,64G 內(nèi)存的服務(wù)器。
本文認(rèn)為,算法檢測(cè)邊界框與人工標(biāo)記邊界框重疊比例超過(guò)70%,則檢測(cè)是正確的;否則,檢測(cè)是錯(cuò)誤。并且,若存在多個(gè)算法檢測(cè)邊界框同時(shí)與某一個(gè)人工標(biāo)記邊界框重疊率符合確認(rèn)的標(biāo)準(zhǔn),則只認(rèn)為其中重疊率最高的為正確檢測(cè)目標(biāo)。本文采用查準(zhǔn)率Precision、查全率Recall作為實(shí)驗(yàn)評(píng)估指標(biāo)。
3.2 實(shí)驗(yàn)結(jié)果分析
筆者將本文提出的算法與基于局域差異分割的方法[2]、基于人工指定典型建筑部位辨識(shí)方法[3]、局部描述子辨識(shí)類(lèi)[4]進(jìn)行比較,并記錄檢測(cè)結(jié)果,結(jié)果如表1所示。
在效率提升方面,由于筆者采取了候選區(qū)的快速篩選策略,因此算法用時(shí)最少,效率最高。性能方面,本文算法構(gòu)建了雙層分類(lèi)網(wǎng)模型,因此能更好地描述關(guān)鍵部位及關(guān)鍵部位間的語(yǔ)義信息,適應(yīng)建筑區(qū)這樣的分布式目標(biāo)檢測(cè),克服其他方法中指定關(guān)鍵部位或者缺乏語(yǔ)義描述的問(wèn)題,在查準(zhǔn)率Precision、查全率Recall兩個(gè)性能指標(biāo)上都優(yōu)于對(duì)比的典型算法。
4 結(jié)論
根據(jù)已有研究的不足,本文提出了一種基于雙層上下文語(yǔ)義網(wǎng)的遙感郊外建筑物檢測(cè)方法。利用疑似區(qū)篩選加鑒別的提取框架,克服已有處理方法中計(jì)算效率低的問(wèn)題。在鑒別階段,采用基于詞包視覺(jué)上下文中層語(yǔ)義特征提取的方法,克服由于建筑物區(qū)域形態(tài)各異、類(lèi)內(nèi)差異大導(dǎo)致的無(wú)法獲取完整可靠建筑區(qū)的情況;同時(shí),構(gòu)建雙層分布網(wǎng)絡(luò),對(duì)關(guān)鍵部位之間進(jìn)行上下文語(yǔ)義描述,克服已有方法因缺乏語(yǔ)義描述導(dǎo)致建筑區(qū)提取效果不佳的問(wèn)題。
參考文獻(xiàn):
[1]易飛,許珊珊.基于SIFT的圖像匹配方法改進(jìn)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2018(10):261-267.
[2]孫萍,鄧?yán)冢櫨?一種基于區(qū)域分割的多尺度遙感圖像融合方法[J].遙感技術(shù)與應(yīng)用,2012(6):844-849.
[3] Izadi M, Saeedi P. Three-Dimensional Polygonal Building Model Estimation From Single Satellite Images[J]. IEEE Transactions on Geoscience & Remote Sensing,2012(6):2254-2272.
[4] Jung C R, Schramm R. Rectangle Detection based on a Windowed Hough Transform[C]// Brazilian Symposium on Computer Graphics & Image Processing. 2004.