許澤宇,沈占鋒,李楊,李均力,王浩宇,李碩,焦淑慧,李苓苓
1.中國科學(xué)院空天信息創(chuàng)新研究院國家遙感應(yīng)用工程技術(shù)研究中心,北京 100101;
2.中國科學(xué)院大學(xué)電子電氣與通信工程學(xué)院,北京 100049;
3.中國科學(xué)院大學(xué)資源與環(huán)境學(xué)院,北京 100049;
4.中國科學(xué)院空天信息創(chuàng)新研究院遙感科學(xué)國家重點(diǎn)實(shí)驗室,北京 100101;
5.中國科學(xué)院新疆生態(tài)與地理研究所綠洲與荒漠國家重點(diǎn)實(shí)驗室,烏魯木齊 830011;
6.新疆遙感與地理信息系統(tǒng)應(yīng)用重點(diǎn)實(shí)驗室,烏魯木齊 830011;
7.應(yīng)急管理部國家減災(zāi)中心,北京 100124
水利基礎(chǔ)空間要素是自然與人工構(gòu)造物的有機(jī)集成,主要包括流域自然特征要素和流域水利工程分布要素,其中水利工程分布要素包含水庫、堤防、水閘、渠道等(許瑩等,2016),本文中研究的水利設(shè)施主要指水利工程樞紐、水閘、渠首,不包括水庫、堤防。水利設(shè)施在發(fā)電、灌溉、洪災(zāi)防控等方面發(fā)揮著重要的作用(Liu等,2013),傳統(tǒng)方法統(tǒng)計水利設(shè)施位置、數(shù)量等數(shù)據(jù)依賴于匯編資料,耗時長且存在資料更新不夠及時、具體地理位置不詳?shù)热秉c(diǎn),而遙感方法可以對水利設(shè)施進(jìn)行快速檢測,包括無法獲得統(tǒng)計資料的區(qū)域,在水利設(shè)施的定期評估等方面有重要應(yīng)用價值。目前,利用遙感影像對河湖等自然要素的研究很多(沈占鋒等,2013;劉康等,2019;王寧等,2020),但對于水利設(shè)施的研究較少(許瑩等,2016)。Li等(2020)在構(gòu)建大規(guī)模遙感影像分類基準(zhǔn)RSI-CB時,分類結(jié)果中雖包含了水利設(shè)施,但僅為簡單分類,且未對水利設(shè)施的具體提取方法進(jìn)行分析;許瑩等(2016)通過建立規(guī)則集對水利空間要素中的自然要素和人工要素都進(jìn)行了提取,提取結(jié)果中河流、湖泊等提取精度較高,而水閘等水利設(shè)施提取精度較低。
基于深度學(xué)習(xí)的目標(biāo)檢測算法,有很高的檢測精度,經(jīng)典的目標(biāo)檢測算法有Faster R-CNN(Ren等,2017)、SSD(Liu等,2016)、YOLO(Redmon等,2016;Redmon和Farhadi,2017和2018)等,其中YOLO算法檢測精度高、時間快,在遙感影像目標(biāo)檢測中具有很好的效果,尤其是在艦船、飛機(jī)等地物的檢測應(yīng)用最廣泛(Hoeser等,2020),在水利設(shè)施檢測中研究還不多。針對艦船目標(biāo)檢測,馬嘯等(2019)通過減少模型層數(shù)和參數(shù)對YOLO網(wǎng)絡(luò)模型進(jìn)行了改進(jìn),獲得了輕量級的網(wǎng)絡(luò)結(jié)構(gòu),有較好的綜合性能;王璽坤等(2020)基于YOLO v3-Tiny算法,增加了特征映射模塊,并引入殘差網(wǎng)絡(luò),改進(jìn)后的算法優(yōu)于SSD和YOLO v3算法;針對飛機(jī)檢測,吳杰等(2021)基于YOLO v3-Tiny算法,通過分組卷積和增加尺度檢測的方法,提高了低質(zhì)量影像中飛機(jī)檢測的效果;鄭志強(qiáng)等(2019)將YOLO v3網(wǎng)絡(luò)中的兩個殘差網(wǎng)絡(luò)模塊替換為兩個密集網(wǎng)絡(luò)模塊,提高了遙感影像中飛機(jī)檢測的準(zhǔn)確率。這些優(yōu)化方案體現(xiàn)了在遙感目標(biāo)檢測中YOLO算法的有效性。
遙感影像面幅大,待檢測地物相對于影像尺度一般很小,直接進(jìn)行檢測效率較低(陶澤遠(yuǎn),2021)。張作?。?018)通過機(jī)場檢測算法,縮小檢測視野、鎖定檢測范圍,以減少計算復(fù)雜。目前研究多是以飛機(jī)檢測為例,其聚集地一般是機(jī)場、跑道、停機(jī)坪等,均為塊狀分布,而水利設(shè)施位置常與河流、湖泊相關(guān),為線狀或塊狀分布;另外,水利設(shè)施檢測對精度的需求高于對速度的需求,由于遙感影像的復(fù)雜性,僅在候選區(qū)檢測可能存在漏檢問題。因此其候選區(qū)域的選擇方案并不適用于水利設(shè)施檢測。
本文基于YOLO v3算法提出了遙感影像水利設(shè)施檢測的方法E-YOLO。E-YOLO使用PPA特征融合方法進(jìn)行低層和高層特征的融合,使用等比預(yù)測框和四特征圖交叉方法進(jìn)行預(yù)測,并結(jié)合損失函數(shù)優(yōu)化和遷移學(xué)習(xí),提高在小樣本水利設(shè)施數(shù)據(jù)上的檢測精度。在此基礎(chǔ)上,提出基于水體指數(shù)約束的大面幅水利設(shè)施檢測方法,通過水體指數(shù)約束滑動窗口步幅,同時降低漏檢率和誤檢率,得到了更優(yōu)的檢測效果。
本文算法主要研究兩個方面:一是針對遙感影像中水利設(shè)施檢測的特點(diǎn),改進(jìn)深度學(xué)習(xí)算法;二是以改進(jìn)后的深度學(xué)習(xí)算法為核心,針對影像和水利設(shè)施尺寸差異較大的問題,提出大面幅影像水利設(shè)施提取算法。
2.1.1 YOLO算法
經(jīng)典的目標(biāo)檢測網(wǎng)絡(luò)R-CNN分為兩步,首先生成可能存在目標(biāo)的區(qū)域,再對區(qū)域進(jìn)行識別分類(Girshick等,2014)。Faster R-CNN通過將兩個步驟作為一個網(wǎng)絡(luò)的兩個分支,縮短運(yùn)算時間,而YOLO系列算法則直接使用一個網(wǎng)絡(luò),同時得到目標(biāo)的位置和類別信息,很好的提高了算法效率(Redmon等,2016)。本文研究在YOLO v3算法的基礎(chǔ)上進(jìn)行改進(jìn),YOLO v3使用了多尺度預(yù)測的方法,即使用3個不同尺度的特征圖,以不同尺度的特征圖檢測不同尺度的物體,從而在多種尺度上都能得到比較精細(xì)準(zhǔn)確的檢測效果(Redmon和Farhadi,2018)。YOLO v3使用Darknet-53網(wǎng)絡(luò)實(shí)現(xiàn)特征提取,相比較YOLO v2中的Darknet-19網(wǎng)絡(luò)添加了殘差單元,達(dá)到了優(yōu)于ResNet的精度,也提高了目標(biāo)檢測的效果(He等,2016)。
2.1.2 E-YOLO算法
本文提出的E-YOLO算法是在YOLO v3基礎(chǔ)上的增強(qiáng)型YOLO算法(Enhanced YOLO),記為“E-YOLO”算法。主要改進(jìn)如下:
(1)提出PPA(PixelShuffle with Point-wise Addition)特征融合方法,由此減少原模型的多層卷積層,比原方法更精簡。
(2)采用等比預(yù)測框與四特征圖交叉預(yù)測的方法。由于樣本量少,初始預(yù)測框大小通過等比推斷確定,而不使用k-means方法,提高魯棒性。
(3)改進(jìn)損失函數(shù),突出置信度損失,增大檢測準(zhǔn)確性。
(4)采用部分遷移學(xué)習(xí)的方法,以同時滿足小樣本訓(xùn)練和網(wǎng)絡(luò)結(jié)構(gòu)改進(jìn)需求。由于樣本量少,保留原DarkNet-53特征提取部分結(jié)構(gòu),訓(xùn)練時讀取預(yù)訓(xùn)練模型進(jìn)行初始化。其它部分由于結(jié)構(gòu)改進(jìn),不讀取預(yù)訓(xùn)練模型。
本文提出PPA融合方法,其流程如圖1所示。首先將高層特征通過1×1的卷積塊提升維度,再通過PixelShuffle算法超分辨率上采樣,上采樣后通道數(shù)與待融合的底層特征通道數(shù)相同,因此直接使用“point-wise addition”逐點(diǎn)相加的方法進(jìn)行融合。通過該方法融合后,特征圖不需要進(jìn)行過多的卷積操作,因此原YOLO v3算法中每次融合后的5次卷積均縮減為1次,結(jié)構(gòu)更精簡高效。
圖1 PPA模塊結(jié)構(gòu)圖Fig.1 Structure diagram of PPA
PPA模塊中PixelShuffle算法最早用于超分辨率重建(Shi等,2016),與雙線性插值法不同,該算法通過子像素卷積(sub-pixel convolution)實(shí)現(xiàn)特征圖的放大(圖2),其上采樣過程可訓(xùn)練,以實(shí)現(xiàn)更好的效果。在PixelShuffle上采樣方法中,圖像通道數(shù)縮減,本文設(shè)置中,通道數(shù)縮減為原來的1/4,圖像行、列放大2倍。在PixelShuffle上采樣前,通過1×1卷積將高層特征圖通道數(shù)提升為低層特征圖通道數(shù)的4倍,這樣通過PixelShuffle后的高層特征圖與低層特征圖的通道數(shù)相同,且放大后的特征圖尺寸也與對應(yīng)低層特征圖相同,因此直接與低層特征圖逐點(diǎn)相加融合,在高效的同時保留了更多的信息。
圖2 子像素卷積算法示意圖Fig.2 Schematic diagram of sub-pixel convolution
由于樣本數(shù)據(jù)較少,使用K-Means算法獲得的預(yù)測框大小偶然性大,因此本文設(shè)計了等比預(yù)測框與四特征圖交叉預(yù)測的方法。由于輸出特征圖大小成等比關(guān)系(2倍),在預(yù)測框設(shè)定時,也以等比方法為主體,公比設(shè)為2,根據(jù)等比方法確定主體預(yù)測框大小,進(jìn)而計算其他預(yù)測框大小,計算公式為:
式中,n=1,2,3,…,9,表示預(yù)測框的序號,k為給定的初始框大小,經(jīng)多次實(shí)驗,本文中取7為最佳值。由式(1)得到9個預(yù)測框大小la1到la9,將其用于4個不同尺度的特征圖的預(yù)測中,如圖3所示。其中b1—b4為輸出特征圖,不同大小的預(yù)測框與不同尺度的輸出特征圖相對應(yīng)。特征圖對應(yīng)預(yù)測框時存在部分重疊,以滿足更復(fù)雜情況的檢測需求。
圖3 特征圖與預(yù)測框關(guān)系圖Fig.3 Relationship between feature map and anchors
YOLO v3中損失函數(shù)由3部分組成,分別用來評估位置形狀、置信度和類別,由于遙感水利設(shè)施檢測只有一類物體,因此本文取消了類別損失。在水利設(shè)施檢測實(shí)際應(yīng)用中,由于會對檢測結(jié)果進(jìn)行后續(xù)整理,因此置信度比位置準(zhǔn)確度更為重要。本研究中增加了置信度損失權(quán)重。最終改進(jìn)后的損失函數(shù)表示為:
式中,lossgiou表示位置和形狀損失,αlossobj表示置信度,通過參數(shù)α調(diào)節(jié)位置和置信度損失權(quán)重,經(jīng)多次實(shí)驗,本文中取α=3為最佳值。
由于樣本數(shù)據(jù)較少,采用部分遷移學(xué)習(xí)的方法。特征提取部分DarkNet-53結(jié)構(gòu)基本不變,僅調(diào)整了各層輸入尺寸,因此在這部分讀取預(yù)訓(xùn)練模型參數(shù)。而在特征融合和YOLO層檢測部分,對網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了較大改進(jìn)調(diào)整,不讀取預(yù)訓(xùn)練模型參數(shù)。
整體上E-YOLO算法與原YOLO v3算法相比,網(wǎng)絡(luò)結(jié)構(gòu)由222層縮減到209層,更為精簡,其網(wǎng)絡(luò)結(jié)構(gòu)見圖4。其中樣本子區(qū)域大小為1000×1000像素,為了減少GPU資源消耗,在輸入影像時,將大小調(diào)整為576×576像素,比子區(qū)域略小。
圖4 E-YOLO結(jié)構(gòu)圖Fig.4 Structure diagram of E-YOLO
針對水利設(shè)施的特點(diǎn),結(jié)合E-YOLO算法的優(yōu)勢,本文提出大面幅遙感影像水利設(shè)施檢測方案。由于大面幅影像的無法直接進(jìn)入卷積神經(jīng)網(wǎng)絡(luò)(Audebert等,2018),因此需要每次讀取子區(qū)域進(jìn)行檢測,通常通過滑動遍歷的方法,完成對整景影像的檢測。常用的大面幅遙感影像檢測方案是先確定候選區(qū)域,然后在候選區(qū)域中檢測,針對水利設(shè)施檢測的特殊性,本文進(jìn)行以下討論:
(1)與飛機(jī)所在的機(jī)場等不同,水利設(shè)施所在的區(qū)域(如河、湖、人工渠等)情況復(fù)雜:既有人工區(qū)域,又有自然區(qū)域;既有線狀區(qū)域,又有面狀區(qū)域;既有連續(xù)區(qū)域,又有間斷區(qū)域。
(2)研究區(qū)存在季節(jié)性水域,且水壩等水利設(shè)施位于水域邊緣,先檢測水域易出現(xiàn)漏檢誤差。
因此,本文研究中均進(jìn)行整景影像遍歷。在使用深度學(xué)習(xí)方法進(jìn)行整體遍歷時,通常會遇到地物被不同子區(qū)域切割等邊界誤差問題。常見的解決方案是通過減小滑動步幅,使不同子區(qū)域間存在重疊,這類方法在城市密集地物提取中起到了很好的效果(Audebert等,2018),由于水利設(shè)施是稀疏地物,在影像中范圍占比較小,全影像重疊檢測會消耗大量資源,且在明顯沒有水利設(shè)施的區(qū)域過多檢測會提高誤檢概率,影響檢測精度。因此本文提出水體指數(shù)約束步幅的檢測方法,實(shí)現(xiàn)在水域集中檢測,非水域快速檢測,以同時降低漏檢率和誤檢率,檢測流程如圖5。
圖5 大面幅水利設(shè)施檢測流程圖Fig.5 Flow diagram of large-scale water conservancy facilities
滑動遍歷時滑動窗口子區(qū)域大小為1000×1000,每個子區(qū)域首先進(jìn)行篩選判斷,如果該區(qū)域值全為0或全為同樣數(shù)值,則不進(jìn)行檢測。在此基礎(chǔ)上,計算子區(qū)域的水體指數(shù)NDWI(Normalized Difference Water Index)(McFeeters,1996),公式如下:
式(3)中,GREEN表示綠波段值,NIR表示近紅外波段值,水體指數(shù)值越大則該位置像元是水體的概率越大,該指數(shù)在水體提取中有顯著效果(駱劍承等,2009;洪亮等,2019)。根據(jù)NDWI得到判斷函數(shù):
式中,Ssmall取750像素,Sbig取1000像素,NDWI閾值w0取0,num(NDWI>w0表示當(dāng)前子區(qū)域中水體指數(shù)大于閾值的像元個數(shù),如果個數(shù)大于閾值n0,則步幅為Ssmall,如果個數(shù)小于閾值n0,則步幅為Sbig。因此,當(dāng)該子區(qū)域存在水體的可能性大時,該區(qū)域附近檢測步幅縮短,相鄰子區(qū)域部分重疊,從而在水域附近檢測密集,其他地方檢測稀疏,增大水體附近檢測成功率,且在其他區(qū)域保持高速率。本文實(shí)驗中,取w0=0,n0=100。子區(qū)域檢測完成后,根據(jù)E-YOLO算法得到的預(yù)測位置生成矢量文件,將置信度寫入矢量文件的屬性中,方便后續(xù)調(diào)整閾值以及檢查整理。
輪廓合并是指有重疊檢測結(jié)果的區(qū)域進(jìn)行合并。傳統(tǒng)目標(biāo)檢測中也有重疊現(xiàn)象,通常采用非極大值抑制(NMS)方法處理(Neubeck和van Gool,2006),即通過IOU判斷重疊度,當(dāng)重疊度超過閾值,去掉置信度低的矩形框。但在此處重疊現(xiàn)象是由于滑動遍歷產(chǎn)生,即同一地物被檢測多次的情況,且存在同一地物被分在不同檢測框檢測,因此,此處不采用NMS方法去掉矩形框,而是將檢測得到的所有輪廓合并,得到最終的結(jié)果,以便得到更完整的檢測結(jié)果(圖6)。
圖6 輪廓合并示例Fig.6 A example of the contour merge
本文以新疆塔里木河流域為樣本區(qū),塔里木河流域周圍是天山南坡—昆侖山—阿爾金山等高原山區(qū),中間是塔里木盆地,河流水系有140多條河流組成,均發(fā)源于盆地周邊高原山區(qū),河流呈向心分布匯入盆地(周莉荔,2010)。2018年6月,研究團(tuán)隊在新疆塔河流域進(jìn)行考察,結(jié)合高分GF-1/GF-2數(shù)據(jù),對塔河流域關(guān)鍵水利樞紐、水庫及生態(tài)閘壩進(jìn)行了遙感制圖及信息建庫,按照阿克蘇河、葉爾羌河、塔河干流、開孔水系4個部分調(diào)研,對塔河關(guān)鍵水利設(shè)施進(jìn)行較為全面的覆蓋。圖7為研究區(qū)及典型水利設(shè)施示意圖。
圖7中,主要水域指主要水系、二級線狀河流、季節(jié)性面狀河流、非季節(jié)性面狀河流、湖泊和水庫。其中喀群渠首、和田河交叉工程和開都河第一分水樞紐為融合后高分二號影像。根據(jù)實(shí)地調(diào)查結(jié)果及在該區(qū)域獲取的高分二號影像數(shù)據(jù),構(gòu)建水利設(shè)施數(shù)據(jù)集,其空間分辨率為0.8 m。由于水利設(shè)施本身較少,且需要保留部分整體影像測試樣本,對訓(xùn)練集進(jìn)行旋轉(zhuǎn)、鏡像處理,以擴(kuò)充數(shù)據(jù)集,使用交叉檢驗方式,即輪換訓(xùn)練樣本與測試樣本,每組540張影像為訓(xùn)練樣本,180張影像為測試樣本,共設(shè)4組進(jìn)行輪換。
圖7 塔里木河流域及典型水利設(shè)施示意圖Fig.7 Tarim River basin and typical water conservancy facilities
本文實(shí)驗環(huán)境為Windows 10系統(tǒng),GTX 1060 6G顯卡,使用Pytorch框架,編程語言為Python。采用精確率(Precision)、召回率(Recall)和綜合精度分?jǐn)?shù)作為結(jié)果的評價指標(biāo),以樣本標(biāo)簽為實(shí)際值,網(wǎng)絡(luò)模型輸出結(jié)果為預(yù)測值;針對某一地物,屬于該地物為正類,不屬于為負(fù)類,實(shí)際和預(yù)測均為正類的目標(biāo)記為TP,實(shí)際為負(fù)類,預(yù)測為正類的目標(biāo)記為FP,實(shí)際為正類,預(yù)測為負(fù)類的目標(biāo)記為FN,得到準(zhǔn)確率和召回率為:
在此基礎(chǔ)上,得到F分?jǐn)?shù):
由式(7)可知,精確率Precision表示檢測正確的目標(biāo)占所有預(yù)測結(jié)果的比值,精確率高則誤檢率低;召回率Recall表示檢測正確的目標(biāo)占所有正確水利設(shè)施區(qū)域的比值,召回率高則漏檢率低。當(dāng)F分?jǐn)?shù)中α=1時,召回率和精確度占有同樣比重,此時為F1分?jǐn)?shù),當(dāng)F分?jǐn)?shù)中α=2時,更偏重召回率,此時為F2分?jǐn)?shù)(方浩文等,2019)。由于水利設(shè)施檢測更注重查全率,為減少漏分現(xiàn)象,本文中以F2分?jǐn)?shù)作為模型效果的最終精度評判。由于使用交叉檢驗的方法,在算法對比時,記錄F2分?jǐn)?shù)的最大值、最小值和平均值,且計算交叉檢驗中各算法F2分?jǐn)?shù)的標(biāo)準(zhǔn)差,以表示多個F2精度的分散程度,用來評估算法的穩(wěn)定性。
研究了原始YOLO v3算法、使用PPA特征融合方式的YOLO v3算法(記為YOLO v3 PPA)和E-YOLO算法,并與目標(biāo)檢測中的經(jīng)典算法SSD進(jìn)行了對比,4種算法均使用了部分遷移學(xué)習(xí)的方法,均訓(xùn)練50 epoch,得到實(shí)驗結(jié)果如表1。
表1 多種算法水利設(shè)施檢測結(jié)果*Table 1 Detection results of various algorithms for hydraulic facilities
表1中為交叉檢驗試驗中各類精度值,Min_F2表示多次實(shí)驗中F2精度最低值,Max_F2表示多次實(shí)驗中F2精度最高值,mF2表示多次實(shí)驗中F2精度平均值,SDF2表示多次實(shí)驗中F2精度標(biāo)準(zhǔn)差(Standard Deviation of F2)。由表1可知,SSD算法各項精度弱于YOLO系列算法。YOLO v3 PPA算法,即在YOLO v3基礎(chǔ)上使用PPA融合方式的算法,在多次實(shí)驗中有精度最高的表現(xiàn),其F2最大值達(dá)到了0.922,但其最低精度為0.848,相差較大。同時根據(jù)標(biāo)準(zhǔn)差可看出,其算法穩(wěn)定性較差,最終平均F2得分也不高。而使用了等比預(yù)測框與四特征圖交叉預(yù)測的E-YOLO算法,則體現(xiàn)了更穩(wěn)定的精度,SDF2僅為0.017,在精度穩(wěn)定的同時,其F2精度平均值也是各算法中的最優(yōu)值,相比YOLO v3提高了1.25%。
圖8為各種算法的檢測效果示意圖,其中第一行水利設(shè)施點(diǎn)僅YOLO v3 PPA和E-YOLO算法正確檢測到;第二行中僅在影像右上角存在為水利設(shè)施,除E-YOLO算法外,其他算法均有多余檢測,即誤檢現(xiàn)象;第三行YOLO v3和YOLO v3 PPA沒有檢測出水利設(shè)施,雖然SSD算法檢測到了水利設(shè)施,但E-YOLO算法的檢測效果更好。綜合來看,E-YOLO算法能比其他算法更有效地對水利設(shè)施進(jìn)行檢測。
圖8 塔里木河流域及典型水利設(shè)施示意圖Fig.8 Tarim River basin and typical water conservancy facilities
根據(jù)本文提出的水體指數(shù)約束的大面幅檢測方案進(jìn)行實(shí)驗分析,使用大面幅高分二號影像進(jìn)行測試,結(jié)果見表2。
表2 大面幅影像檢測結(jié)果Table 2 Large format image detection results
由表2可知,步幅為1000像素的方案中,精確度最高,用時最短,但其召回率和F2分?jǐn)?shù)較低,由于檢測沒有重疊區(qū)域,水利設(shè)施處檢測次數(shù)少、存在邊緣漏檢情況,使整體漏檢數(shù)偏多,而步幅為750像素的方案中,召回率明顯提升,但由于在沒有水利的區(qū)域檢測次數(shù)多,其誤檢數(shù)偏多,精確度較低,因此最終的F2分?jǐn)?shù)也不高,且其檢測時間很長。根據(jù)水體指數(shù)調(diào)整步幅的方案,可以實(shí)現(xiàn)在水域集中重疊檢測和非水域少量快速檢測,同時減少了漏檢和誤檢現(xiàn)象,其召回率與步幅為750像素的方案相近,漏檢少,其精確率與步幅為1000像素的方案相近,誤檢少,因此水體指數(shù)約束方法的F2綜合精度分?jǐn)?shù)是3種方案中的最高值,相比大步幅和小步幅方法分別提高了3.72%和2.70%。
圖9展示了不同大面幅檢測方案結(jié)果的對比效果,由于影像面幅大且水利設(shè)施稀疏,水利設(shè)施以點(diǎn)表示,左下角為細(xì)節(jié)放大圖。在圖9中,第一行放大區(qū)域步幅1000像素的方案存在漏檢,而步幅750像素和本文方案由于在水域檢測密集,避免了漏檢現(xiàn)象;第二行,步幅750像素的方案存在明顯的誤檢現(xiàn)象,通過放大圖可以看出,將其他建筑錯誤檢測為了水利設(shè)施,而本文提出的方法在非水體區(qū)域步幅較大,檢測不密集,降低了類似誤檢情況的發(fā)生率;第三行,步幅為1000像素的算法則提取了一處水利設(shè)施的兩個小區(qū)域,而步幅為750像素和水體指數(shù)約束算法,得到了更完整的檢測結(jié)果。綜合對比可以看出,使用水體指數(shù)約束的方法同時避免了漏檢和誤檢現(xiàn)象,且檢測效果更完整。
圖9 不同大面幅檢測方案結(jié)果對比圖Fig.9 Comparison of the results of different large-format image detection methods
本文針對遙感影像中的水利設(shè)施檢測,以新疆塔里木河流域為研究區(qū),以YOLO v3算法為基礎(chǔ),提出了更有效的水利設(shè)施檢測方案。在檢測算法方面,提出改進(jìn)后的E-YOLO算法,提出PPA特征融合方法和等比預(yù)測框與四特征圖交叉預(yù)測方法,結(jié)構(gòu)更加精簡高效,且優(yōu)化了小樣本問題;改進(jìn)損失函數(shù),突出置信度損失,使水利設(shè)施檢測更準(zhǔn)確;同時使用遷移學(xué)習(xí)的方法,讀取特征提取部分的預(yù)訓(xùn)練模型參數(shù)。改進(jìn)后的E-YOLO算法平均F2精度相比YOLO v3提高了1.25%,且穩(wěn)定性更強(qiáng)。在大面幅影像目標(biāo)檢測方面,提出水體指數(shù)約束步幅和輪廓合并的方法,同時降低了漏檢率和錯檢率,其F2精度相比大步幅和小步幅方法分別提高了3.72%和2.70%,達(dá)到了最優(yōu)的精度。本文方法在大面幅高分辨率影像中對水利設(shè)施有很好的提取效果,但在中低分別率影像中的水利設(shè)施尺寸較小,且形狀、紋理等特征信息不明顯,其自動提取方法及效果有待進(jìn)一步研究。