陳 超,丁 婷,楊 錦
(1.江蘇省基礎(chǔ)地理信息中心,江蘇 南京 210013)
基礎(chǔ)測繪是為經(jīng)濟建設(shè)、國防建設(shè)和社會發(fā)展提供地理信息的基礎(chǔ)性公益性事業(yè),是經(jīng)濟社會可持續(xù)發(fā)展的重要支撐。《全國基礎(chǔ)測繪中長期規(guī)劃綱要(2015-2030年)》提出要構(gòu)建新型基礎(chǔ)測繪,并明確其應(yīng)具備“全球覆蓋、海陸兼顧、聯(lián)動更新、按需服務(wù)、開放共享”等特征,各地都已進行了一定的探索。開展重要基礎(chǔ)地理信息快速、及時更新,既是常規(guī)更新工作的重要補充,也是新型基礎(chǔ)測繪的擴展。
我國通過高分專項工程已初步構(gòu)建了高分衛(wèi)星遙感系統(tǒng),基本形成涵蓋不同空間分辨率、不同覆蓋寬度、不同譜段、不同重訪周期的高分數(shù)據(jù)體系,這些遙感影像在土地利用、城市規(guī)劃、農(nóng)業(yè)管理、軍事偵察等方面已發(fā)揮了重要作用[1-4]。傳統(tǒng)方法是通過人為設(shè)計的紋理特征、HOG[5]、LBP[6]、SIFT[7]、Bag-Of-Words[8]等各類特征對影像進行目標檢測。近年來,深度學(xué)習(xí)在遙感影像應(yīng)用方面已有出色表現(xiàn),尤其是卷積神經(jīng)網(wǎng)絡(luò)(CNN)[9]成為最熱門的深度學(xué)習(xí)模型算法之一。它無需設(shè)計目標特征,能根據(jù)海量樣本數(shù)據(jù)自行提取有效特征[10-11],且具有良好的泛化能力,在復(fù)雜情況下依然能夠保持良好的穩(wěn)健性[3,12]。余東行[13]等利用小尺度淺層神經(jīng)網(wǎng)絡(luò)實現(xiàn)了快速目標搜索,利用深層CNN在候選目標中進行了精確定位;任媛媛[14]等對Fast R-CNN網(wǎng)絡(luò)進行了改進,通過共享卷積層參數(shù)來降低參數(shù)規(guī)模,并利用改進方法實現(xiàn)了農(nóng)村建筑物的目標檢測;徐啟恒[15]等結(jié)合主成分分析、超像素分割與CNN對國產(chǎn)高分辨率遙感影像開展了云檢測。
本文基于高分辨率遙感影像,利用CNN完成了電線塔的識別,并進行增量入庫。首先基于基礎(chǔ)測繪本底矢量數(shù)據(jù)構(gòu)造樣本影像塊;再利用CNN對電線塔進行識別,實現(xiàn)高精度提??;然后將提取結(jié)果與本底矢量數(shù)據(jù)對比分析,形成增量要素;最后直接更新基礎(chǔ)測繪數(shù)據(jù)庫。
CNN是受生物神經(jīng)學(xué)啟發(fā)而產(chǎn)生的。一個典型的CNN由輸入層、卷積層、池化層、全連接層和輸出層組成,其中輸入層為遙感影像;卷積層為上一層的局部卷積結(jié)果,用以提取特征,越深的CNN提取的特征越具體;池化層主要用于特征降維,壓縮數(shù)據(jù)和參數(shù)的數(shù)量,包括最大池化和平均池化,卷積層和池化層也稱隱藏層;全連接層用于對已取得的特征信息作加權(quán)和,在網(wǎng)絡(luò)中扮演“分類器”的角色;輸出層為分類結(jié)果。帶有兩個隱藏層的CNN如圖1所示。
圖1 帶有兩個隱藏層的CNN
CNN的工作流程為:首先對輸入影像進行卷積運算,再通過池化層對卷積特征圖進行降采樣,然后重復(fù)進行卷積與池化操作,最后通過全連接層對最終的特征進行分類,并輸出結(jié)果。卷積運算的計算公式為:
式中,l為卷積層數(shù);xlj為第l層的第j個輸出特征圖;為第l層的卷積核;f(·)為激活函數(shù);*為卷積運算符為第l層的偏置;Mj為第l-1層的特征圖數(shù)量。
池化運算的計算公式為:
式中,down(·)、β分別為下采樣函數(shù)和系數(shù)。
本文選取的實驗影像為無人機影像,影像分辨率為0.9 m,3個波段分別為藍、綠、紅,影像覆蓋面積約為74.55 km2。圖2中紅線所示范圍為校正區(qū)域,紅線范圍外影像為訓(xùn)練區(qū)域,用于獲取樣本影像塊參與訓(xùn)練。
圖2 實驗影像與區(qū)域劃分
本文實驗基于eCognition軟件中的CNN工作流完成。eCognition中的CNN方法基于Google的TensorFlow API開發(fā),形成了完整的工作流,包括3個步驟:①采集目標與非目標樣本;②利用樣本訓(xùn)練網(wǎng)絡(luò),即通過校正各權(quán)重來優(yōu)化樣本分類精度;③利用訓(xùn)練好的網(wǎng)絡(luò)對未參與訓(xùn)練的校正區(qū)域進行分類,創(chuàng)建目標類別熱力圖。
2.2.1 創(chuàng)建樣本
本文選擇電線塔作為待更新要素。電線塔是呈梯形或三角形的塔狀建筑物,高度通常為25~40 m,鋼架結(jié)構(gòu),多建設(shè)在野外,特征較明顯。在1∶10 000基礎(chǔ)測繪數(shù)據(jù)中,電線塔均表示為定位點。結(jié)合本底矢量數(shù)據(jù)與訓(xùn)練區(qū)域創(chuàng)建的樣本影像塊可知,訓(xùn)練區(qū)域內(nèi)包括187個電線塔的定位點,非目標樣本矢量包括植被2 512個、房屋1 800個、道路1 236個、水域452 個。為了增加目標影像塊的數(shù)量以及提高網(wǎng)絡(luò)的魯棒性,對每個樣本點作3×3的緩沖處理,這樣每個樣本點就成了9個點,最終獲取3 500個目標樣本影像塊和30 000個非目標樣本影像塊,影像塊尺寸均為30像素×30像素。目標與非目標樣本影像塊的示例如圖3所示。
圖3 訓(xùn)練樣本影像塊
2.2.2 訓(xùn)練網(wǎng)絡(luò)
訓(xùn)練網(wǎng)絡(luò)時,采用深度為1的隱藏層,隱藏層內(nèi)卷積核尺寸為11×11,創(chuàng)建了40個特征地圖;采用最大池化,學(xué)習(xí)率為0.001 5,訓(xùn)練步數(shù)為5 000,每步訓(xùn)練用到的樣本數(shù)量為50。訓(xùn)練中,學(xué)習(xí)率參數(shù)用于調(diào)整統(tǒng)計梯度下降算法,并可改變每次迭代運算中網(wǎng)絡(luò)權(quán)重參數(shù)的更新幅度;若學(xué)習(xí)率設(shè)置過小,學(xué)習(xí)過程不僅很慢,而且可能以局部最優(yōu)設(shè)置結(jié)束;若學(xué)習(xí)率設(shè)置過大,則將加快訓(xùn)練速度,但可能會錯過最優(yōu)值或?qū)е履P蜔o效。本文以軟件推薦的經(jīng)驗值0.001 5為基礎(chǔ),以0.000 1為步長分別嘗試了不同的參數(shù),最終選擇了運行效率與學(xué)習(xí)效果最佳的參數(shù)。網(wǎng)絡(luò)訓(xùn)練共耗時2~3 min,將訓(xùn)練后的網(wǎng)絡(luò)應(yīng)用于校正區(qū)域,即可得到分類結(jié)果的熱力圖。其值接近于1表示與目標有較高的相似性,接近于0則表示與目標的相似性較低。
2.2.3 實驗結(jié)果與分析
圖4 a為校正區(qū)域的熱力圖,為了降低噪聲影響,已經(jīng)過平滑處理,越紅的區(qū)域表示相似性越大;圖4b為最終的識別結(jié)果;圖4c為熱力圖的局部放大圖;圖4d為圖4c熱力圖得到的識別結(jié)果,已正確識別出4個電線塔;圖4e、4f為另外兩個放大區(qū)域的識別結(jié)果,圖4e正確識別出3個電線塔,其中一個電線塔的識別位置與樣本點位置稍有差異,漏識別2個、誤識別1個,圖4f正確識別出4個電線塔、誤識別2個。
圖4 實驗結(jié)果
本文分別從檢測率(DR)、誤檢率(FPR)兩個方面對最終結(jié)果進行評價。
式中,TP為正確檢測出的數(shù)量;MP為漏檢測數(shù)量;FP為誤檢測數(shù)量。
本文將識別位置與樣本數(shù)據(jù)略有差異、但指向同一個電線塔的識別結(jié)果作為正確檢測。整個校正區(qū)域正確識別出電線塔25個、漏識別8個、誤識別15個,DR為0.758,FPR為0.375。通過分析發(fā)現(xiàn),由于道路、硬化地表等部分地物的光譜表現(xiàn)與電線塔近似,因此誤識別的電線塔數(shù)量較多,后續(xù)研究將通過加入其他特征進行后處理,從而進一步降低FPR。
2.3.1 增量定義
將利用CNN獲取的電線塔點作為新數(shù)據(jù),與本底矢量數(shù)據(jù)進行疊置分析,并將新數(shù)據(jù)標記為“增加/修改/未變化”,本底數(shù)據(jù)標記為“刪除”要素。
本文對各標記的定義為:①不存在于本底數(shù)據(jù),僅存在于新數(shù)據(jù)的定義為“增加”;②本底數(shù)據(jù)圖層中的幾何要素整體消失定義為“刪除”;③圖形空間位置變化、屬性變化的定義為“修改”。
2.3.2 增量入庫
1)對于“增加”的電線塔,直接更新入庫;結(jié)合網(wǎng)絡(luò)爬蟲、外業(yè)調(diào)繪等手段獲取電線塔對應(yīng)的電力線名稱,并在本底庫中更新電力線和屬性。
2)對于本底數(shù)據(jù)中標記為“刪除”的電線塔,不做處理,僅為邏輯刪除。
3)對于“修改”的電線塔,刪除并替換本底數(shù)據(jù)庫中對應(yīng)位置的電線塔,同時在本底庫中更新電力線位置。
4)對于“未變化”要素,不做任何處理。
在校正區(qū)域正確檢測出的25個電線塔中,標記為“增加/修改/未變化”的要素分別有2個、0個、23個,本底數(shù)據(jù)中標記為“刪除”的電線塔為0個。
本文利用CNN方法對遙感影像中的電線塔要素進行提取,通過疊置分析完成了本底數(shù)據(jù)的增量入庫,并通過實驗證明了該方法的可行性。后續(xù)研究將加入其他特征對識別結(jié)果進行后處理,以降低FPR;同時對形成的規(guī)則集開展移植性實驗,包括對不同來源、不同分辨率的影像開展提取實驗,探索規(guī)則集需調(diào)整的內(nèi)容,以提高規(guī)則集的通用性,為基礎(chǔ)地理信息的快速更新提供有效手段。