許瀕支 朱 慶 李海峰 胡 翰 丁雨淋 陳 琳
1 西南交通大學(xué)地球科學(xué)與環(huán)境工程學(xué)院,四川成都,611756
2 中南大學(xué)地球科學(xué)與信息物理學(xué)院,湖南長沙,410012
滑坡具有隱蔽性、突發(fā)性,常發(fā)生在復(fù)雜艱險山區(qū),人工實地詳查困難,需要借助無人機(jī)航拍影像和衛(wèi)星遙感影像進(jìn)行排查?;麦w向下堆積可能會造成道路中斷、建筑物受損、人員傷亡,甚至引發(fā)堰塞湖等一系列次生災(zāi)害。考慮到滑坡的復(fù)雜性和危害性,獲取滑坡影像后,如何快速、精準(zhǔn)地提取滑坡至關(guān)重要。目前,傳統(tǒng)滑坡提取方法主要包括目視解譯法、特征設(shè)計法。
目視解譯法是基于專家經(jīng)驗,人工交互地對滑坡進(jìn)行識別,可以精確地確定滑坡類型及邊界,但是目視解譯法需要豐富的專業(yè)知識和大量人力物力,在發(fā)生突發(fā)大面積滑坡時耗時過長,無法迅速響應(yīng)?;谔卣髟O(shè)計的提取方法是根據(jù)滑坡的特點及光譜特征,人工選取滑坡紋理、色彩、色調(diào)等淺層特征,為每個特征調(diào)整合適的參數(shù)和閾值來區(qū)分滑坡與背景,適用于災(zāi)害發(fā)生后的快速災(zāi)情評估工作,此類方法可分為像素級特征設(shè)計方法和面向?qū)ο蠹壍奶卣髟O(shè)計方法,像素級特征設(shè)計方法利用多時相遙感影像以及其他輔助數(shù)據(jù)分析遙感影像物源變化特征,設(shè)計并篩選合適的特征進(jìn)行多尺度分割,實現(xiàn)滑坡的快速提取[1?4];面向?qū)ο蠹壍奶卣髟O(shè)計方法通過探討滑坡災(zāi)害影像多維遙感解譯方法,建立對象級滑坡提取模型[5],在此基礎(chǔ)上,選擇合適的特征屬性進(jìn)行滑坡提取[6]。上述方法主要是通過特征設(shè)計結(jié)合傳統(tǒng)分類對滑坡進(jìn)行特征提取,可得到較高精度,但需要時序影像或者人為設(shè)置多個閾值因子,很難被應(yīng)用于復(fù)雜多樣的滑坡場景。
近年來,深度卷積網(wǎng)絡(luò)在遙感影像語義分割方面取得明顯突破,深度卷積神經(jīng)網(wǎng)絡(luò)通過自學(xué)習(xí)的方式從大量樣本中學(xué)習(xí)語義特征,一定程度上避免了人工設(shè)計的局限性。但卷積神經(jīng)網(wǎng)絡(luò)(convolu?tional neural network,CNN)本質(zhì)仍然是一種局部方法,通過下采樣增大感受野,因此當(dāng)光譜特征一致或者目標(biāo)尺度差異較大時,分割結(jié)果準(zhǔn)確率明顯降低。
針對目前滑坡尺度差異大、滑坡和其他地物存在光譜混淆的問題,本文在經(jīng)典殘差網(wǎng)絡(luò)(residual network,ResNet)——ResNet50的基礎(chǔ)上,引入金字塔結(jié)構(gòu),用以融合不同尺度的特征,增強(qiáng)網(wǎng)絡(luò)模型在不同尺度滑坡的特征提取能力;引入通道注意力模塊(channel attention module,CAM),聚合上下文信息,篩選更有用的語義通道信息,抑制干擾信息,增強(qiáng)網(wǎng)絡(luò)模型區(qū)別混淆的能力;并將兩個模塊嵌入Res Net50骨架模型,實現(xiàn)特征的深度融合,提高滑坡的識別精確度。本文以2017年8月8日九寨溝地震震后無人機(jī)遙感影像為例,構(gòu)建滑坡數(shù)據(jù)集,設(shè)計對比實驗,測試本文方法對滑坡影像的提取效果。
滑坡語義分割通過CNN以自學(xué)習(xí)的方式建立影像和標(biāo)簽之間的一一對應(yīng)關(guān)系,為滑坡影像逐像素分配語義類別,從而獲得滑坡標(biāo)簽、位置和像元的形狀。在滑坡航拍影像上,航高變化和地形起伏會導(dǎo)致滑坡尺度多變與滑坡體間尺度的差異,本文在Res Net50的基礎(chǔ)上進(jìn)行改進(jìn),首先嵌入金字塔池化結(jié)構(gòu),提取圖像的多尺度特征,有效融合多尺度的上下文信息;其次在特征和注意力機(jī)制之間建立關(guān)聯(lián)來探索全局語義關(guān)聯(lián)信息,通過自學(xué)習(xí)的方式獲取每個特征通道的權(quán)值(描述該特征通道的重要程度),依照這個權(quán)值篩選更有用的語義通道信息。
本文的語義分割模型整體框架見圖1,L1~L5分別為Res Net50的5個模塊,第5模塊提取的特征通過金字塔池化得到多尺度聚合特征;再通過CAM將特征提取的卷積結(jié)果作為注意力模型的輸入;最后通過L6上采樣模塊得到滑坡分割圖。
圖1 本文方法Fig.1 The Proposed Method
Res Net為經(jīng)典的語義分割骨架網(wǎng)絡(luò)[7],在此基礎(chǔ)上衍生了一系列改進(jìn)模型,其跳轉(zhuǎn)鏈接結(jié)構(gòu)能有效抑制梯度消失和梯度爆炸問題。通過實驗發(fā)現(xiàn),ResNet50系列比U?Net[8]更適合處理滑坡,其參數(shù)量小,運(yùn)行負(fù)載低,作為骨架網(wǎng)絡(luò),具有更靈活的性能。ResNet50殘差結(jié)構(gòu)采用三層殘差學(xué)習(xí)模塊,適用于深層網(wǎng)絡(luò)訓(xùn)練,殘差結(jié)構(gòu)使用跳轉(zhuǎn)鏈接將輸入x直接映射到輸出端,并未增加任何其他參數(shù),在深層次網(wǎng)絡(luò)中,能緩解退化問題,還能有效減少計算量[7]。ResNet50結(jié)構(gòu)見圖2。
圖2 ResNet50結(jié)構(gòu)Fig.2 Structure of ResNet50
在CNN中,池化層簡化計算復(fù)雜度,擴(kuò)大感受野,在前向傳播中具有重要作用。進(jìn)行池化操作時,圖像丟失大部分細(xì)節(jié)信息,造成精度的損失。無人機(jī)影像中滑坡尺度差異巨大,且滑坡內(nèi)部紋理單一,連續(xù)的池化操作容易漏掉一些小滑坡,或者部分大滑坡被判別為其他地物。因此,針對滑坡影像,提取圖像的多尺度特征,有助于減少空間信息損失。金字塔池化結(jié)構(gòu)在傳統(tǒng)池化方式基礎(chǔ)上,將不同區(qū)域的上下文信息結(jié)合起來,獲取不同尺度上的融合特征,提升對不同尺度目標(biāo)的分割效果[9]。
本文的金字塔結(jié)構(gòu)分為4層:第1層直接進(jìn)行全局平均池化,第2層被劃分為4個子區(qū)域,第3層被劃分為9個子區(qū)域,第4層被劃分為36個子區(qū)域。在每一個子區(qū)域中采用全局池化的策略進(jìn)行特征提取,使用1×1卷積降維對每層結(jié)果進(jìn)行降維,再通過上采樣和通道融合輸出最終特征圖。
人類觀察圖像常通過注意力來迅速定位物體可能存在的區(qū)域,引入注意力機(jī)制也可以幫助神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到全局信息,提升性能。在語義分割領(lǐng)域,自注意力[10]、non?local neural networks[11]、squeeze?and?excitation networks[12]已被提出并被廣泛應(yīng)用。針對山區(qū)滑坡影像存在上下文信息分散、滑坡尺度變化大的情況,使用注意力機(jī)制,只需判斷少量潛在信息,過濾掉不重要的特征,更加關(guān)注有價值的信息,能在一定程度上克服光譜特征近似地物的干擾。因此,考慮在滑坡影像上使用CAM篩選有用的通道信息,聚焦滑坡區(qū)域。
經(jīng)過卷積操作Ft得到三維(H×W×C)的特征圖U,通過權(quán)重抽取Fs、權(quán)重更新Fe、權(quán)重分配Fa3個步驟的運(yùn)算得到最終結(jié)果xˉc。
式中,i、j對應(yīng)像素點的位置;uc∈RH×W,表示二維信息,其中,RH×W表示H×W的空間;Fs采用全局平局池化對uc進(jìn)行壓縮,得到多通道全局信息Zc。
式中,σ表示Relu激活函數(shù);δ表示Sigmoid函數(shù);,其中,r=16;經(jīng)過相乘的全連接操作和Sigmoid激活層后,再經(jīng)過相乘的全連接操作和Relu激活層,得到學(xué)習(xí)后的權(quán)重s。
式中,sc代表權(quán)重信息。
由上述過程可知,CAM的引入有助于篩選重要信息,提高特征可辨性,增強(qiáng)特征指向性。
本文采用精度、召回率、F1?score和交并比(in?tersection?over?union,Io U)4個指標(biāo)對模型進(jìn)行性能評估。精度表示預(yù)測正確的正類個數(shù)占全部預(yù)測為正的比例;召回率表示預(yù)測正確的正類個數(shù)占全部正類的比例;F1?score同時考慮了精度和召回率的平衡;Io U是語義分割的常用度量。計算公式如下:
式中,P、R、F、I分別表示精度、召回率、F1?score、Io U;tp表示分類正確的正類;fp表示誤分為正類;fn表示未分出的正類。較高的精度值表示著較少的誤檢,較高的召回值表示著較少的漏檢,F(xiàn)1?score、Io U揭示了整體性能。
2.1.1 實驗數(shù)據(jù)
2017年8月8日,四川省九寨溝發(fā)生7.0級地震,引發(fā)大量的山體滑坡,造成嚴(yán)重危害[13,14]。本文實驗數(shù)據(jù)為九寨溝震后獲取的無人機(jī)遙感影像和生成的數(shù)字正射影像,如圖3所示,分辨率為0.2 m。低空無人機(jī)獲取的影像具有分辨率高的優(yōu)勢,可精準(zhǔn)地確定滑坡的空間分布[15]。新生滑坡破壞原有地形,新的滑坡構(gòu)造面反射率較高,由于九寨溝山區(qū)的光照特性,房屋、河流也容易出現(xiàn)反射效應(yīng),為無人機(jī)影像滑坡的自動提取帶來了困難。在無人機(jī)影像中,滑坡呈現(xiàn)出大小不一、形狀復(fù)雜、與周圍地物交錯混淆的特征?;露逊e物向下掩蓋地物,部分滑坡靠近道路、房屋、河流,造成道路、河流堵塞、建筑物損壞,在無人機(jī)影像上造成地物混淆,滑坡解譯容易產(chǎn)生漏分和誤分。
圖3 研究區(qū)域及影像Fig.3 The Study Area and Images
2.1.2 實驗數(shù)據(jù)集制作
對九寨溝滑坡無人機(jī)遙感影像進(jìn)行標(biāo)注、增強(qiáng)等一系列預(yù)處理操作。根據(jù)整幅影像標(biāo)注相應(yīng)地物標(biāo)簽,滑坡像素數(shù)值為255,其他地物像素數(shù)值為0。按照512×512像素大小裁剪原始影像。由于整幅影像中滑坡占比較少,用算法對滑坡旋轉(zhuǎn)90°、180°、270°能保證識別到更多的滑坡形態(tài)特征。剔除過多無意義的背景切片,共得到總的數(shù)據(jù)訓(xùn)練集3 431張影像。本文選用兩幅區(qū)域影像作為測試集,為減少拼接痕跡,使用256像素的跨幅重疊影像裁剪得到512×512像素的測試影像2 036張,部分訓(xùn)練集見圖4。
圖4 部分訓(xùn)練集Fig.4 Part of the Training Sets
2.1.3 實驗環(huán)境
滑坡提取實驗平臺為Ubuntu 18.04系統(tǒng);深度學(xué)習(xí)軟件框架為Tensor Flow 1.9,內(nèi)置的Python版本 為3.6.1;訓(xùn)練設(shè)備為Intel(R)Core(TM)i7?8700K CPU@3.70 GHz處理器;16 GB內(nèi)存;顯卡為NVIDIA TITAN RTX顯卡。實驗訓(xùn)練批次大小為12,迭代90輪,學(xué)習(xí)率為1×10?3。模型通過隨機(jī)梯度下降對網(wǎng)絡(luò)的權(quán)重和偏置進(jìn)行更新。
為便于將本文方法與其他方法進(jìn)行比較,利用全卷積網(wǎng)絡(luò)(fully convolutional network,F(xiàn)CN)[16]、U?Net、ResNet50和本文方法對相同的數(shù)據(jù)進(jìn)行訓(xùn)練和測試?;聰?shù)據(jù)包含訓(xùn)練影像和測試影像,選取具有代表性的兩個滑坡區(qū)域進(jìn)行測試,對這兩個區(qū)域的滑坡類內(nèi)差別和地物混淆情況進(jìn)行結(jié)果展示和分析。
2.2.1 地區(qū)1
表1中給出了各個方法在地區(qū)1測試數(shù)據(jù)上的各項對比,本文方法的F1?score值和Io U值分別為0.779和0.638,優(yōu)于FCN?16s、U?Net、Res Net50。在圖5中,地區(qū)1的地物構(gòu)成復(fù)雜,包括房屋、道路、河流、農(nóng)田、房屋道路附近的院落和裸地,以及與滑坡紋理相仿的河床。九寨溝訓(xùn)練影像相關(guān)負(fù)樣本較少,造成了一定的區(qū)分難度,針對左上方農(nóng)田和下方的河床,利用其他方法獲取的結(jié)果中存在較多地物混淆現(xiàn)象,本文方法在保證召回率的情況下,對滑坡判斷更加準(zhǔn)確。
表1 地區(qū)1精度對比Tab.1 Accuracy Comparison in Region 1
圖5 地區(qū)1的測試效果Fig.5 Test Results in Region 1
2.2.2 地區(qū)2
表2中給出了地區(qū)2的影像精度驗證結(jié)果,本文方法的F1?score值和Io U值達(dá)到0.879和0.784,優(yōu)于FCN?16s、U?Net、ResNet50。由圖6可以看出,下方河流及河床容易出現(xiàn)錯誤識別。相較于FCN、U?Net和Res Net50方法,本文方法輸出結(jié)果中,混淆區(qū)域的滑坡識別精度明顯提高,只出現(xiàn)了部分錯誤分類結(jié)果,分割邊界更加清晰并且更加規(guī)整,表明本文方法更為有效。
圖6 地區(qū)2的測試效果Fig.6 Test Results in Region 2
表2 地區(qū)2精度對比Tab.2 Accuracy Comparison in Region 2
由地區(qū)1和地區(qū)2的實驗結(jié)果可知,F(xiàn)CN?16s、U?Net、ResNet50經(jīng)典模型仍有局限性,導(dǎo)致影像中部分地物被誤判為滑坡;在地區(qū)1和地區(qū)2中,本文方法的精度、召回率、F1?score和IoU 4個指標(biāo)都達(dá)到最優(yōu),相較于其他方法,本文方法準(zhǔn)確地判斷了滑坡。
針對傳統(tǒng)滑坡提取方法中滑坡尺度差異大、易混淆的問題,本文結(jié)合CNN的優(yōu)勢,建立了多尺度深度注意力模型,并在九寨溝滑坡數(shù)據(jù)集上,實現(xiàn)了滑坡的精準(zhǔn)提取。實驗結(jié)果表明,本文方法有效地提高了滑坡提取精度,為后續(xù)滑坡危險性評估、災(zāi)害詳查、災(zāi)情預(yù)警等提供參考。然而,本文所獲取的滑坡影像中,有效樣本較少,在今后,需要建立更豐富的無人機(jī)滑坡影像數(shù)據(jù)集,并設(shè)計更為高效的網(wǎng)絡(luò),進(jìn)一步解決滑坡和其他光譜混淆地物的有效區(qū)分問題,提高滑坡提取精度。