李 夏 ,李 媛 ,張 博
(1.水利部信息中心,北京 100053;2.北京化工大學(xué)化學(xué)工程學(xué)院,北京 100029;3.航天科工集團智慧產(chǎn)業(yè)發(fā)展有限公司,北京 100854)
“圍繞落實最嚴(yán)格的生態(tài)環(huán)境保護制度,實行最嚴(yán)格的水土保持監(jiān)管”是水土保持工作在當(dāng)下及今后一段時期的重要任務(wù)。2018 年水利部黨組水利行業(yè)強監(jiān)管要求將生產(chǎn)建設(shè)項目造成的人為水土流失作為監(jiān)管的重中之重[1-2]。衛(wèi)星遙感對地觀測系統(tǒng)以其周期短、時效性高、觀測范圍廣等特點在生產(chǎn)建設(shè)項目監(jiān)管中具有顯著優(yōu)勢?;谛l(wèi)星遙感影像結(jié)合無人機巡查及地面實地勘察,開展在建生產(chǎn)建設(shè)項目水土保持監(jiān)管,是生產(chǎn)建設(shè)項目水土保持事中事后監(jiān)管的重要探索與實踐?;谶b感技術(shù)開展生產(chǎn)建設(shè)項目水土保持監(jiān)管,最為關(guān)鍵的是通過分析下墊面地物光譜紋理等特點總結(jié)出目標(biāo)地物的表征特征,構(gòu)建基于地物特征的自動識別模型,提高生產(chǎn)建設(shè)項目發(fā)現(xiàn)的效率和精度。生產(chǎn)建設(shè)項目在施工建設(shè)過程中,典型表現(xiàn)為大面積的裸露地表和要求布設(shè)的臨時水土保持措施。水土保持措施包括工程、植被和臨時攔擋措施。工程和植被措施大多在項目建設(shè)后期建成,并且形態(tài)多樣,通過遙感自動識別難度較大。臨時攔擋、排水措施目標(biāo)較小,需要優(yōu)于 0.2 m 的無人機影像識別。臨時植被措施覆蓋度低,與裸露地表容易混淆。臨時苫蓋措施(防塵網(wǎng))面積大,紋理清晰,地物邊界明顯,可以作為生產(chǎn)建設(shè)項目的識別目標(biāo)?;诟叻直媛视跋竦哪繕?biāo)識別已取得了較大的進展,傳統(tǒng)方法多基于遙感影像中地物的表象特征。李霞、徐涵秋等[3-4]采用 NDSI 和 NDISI 指數(shù)法,解決裸土信息和建筑用地信息混淆的問題,查明了福建區(qū)域地表裸土分布的時空變化情況,但傳統(tǒng)方法無法利用圖像深層特征的語義信息,且無法實現(xiàn)目標(biāo)地物的自動化識別。近年來,深度學(xué)習(xí)語義分割網(wǎng)絡(luò)模型(FCN,Segnet,RefineNet,PSPNet,DeepLabv3+)被廣泛應(yīng)用于遙感影像的目標(biāo)自動識別,其中 PSPNet(Pyramid Scence Parsing Network),DeepLabv3+ 應(yīng)用最為廣泛且識別結(jié)果明顯優(yōu)于其他。劉培等[5]使用 PSPnet 算法實現(xiàn)尾礦庫結(jié)構(gòu)分割,得到了尾礦庫內(nèi)部結(jié)構(gòu)(壩體及庫區(qū)),為尾礦庫分布信息提取提供了技術(shù)支持;武花等[6]提出了一種融合多特征改進型 PSPNet 模型,提高了復(fù)雜場景下建筑物提取的精度;陳周等[7]基于 World View 影像,使用DeepLabv3+ 對城市綠地進行分割研究,然后在分割基礎(chǔ)上進行城市綠地信息提取,結(jié)果表明 Ostu,MeanShift,F(xiàn)NEA 分割算法相比 DeepLabv3+ 的分割性能最好;郝明等[8]基于 DeepLabv3+ 深度網(wǎng)絡(luò),利用生成的數(shù)據(jù)集進行無人機影像建筑物變化遷移學(xué)習(xí),最終實現(xiàn)建筑物變化檢測。綜上所述,PSPNet,DeepLabv3+ 對遙感影像中的目標(biāo)識別均取得了顯著成效,但二者均未曾應(yīng)用于生產(chǎn)建設(shè)項目,且對于在建生產(chǎn)建設(shè)項目特征地物(防塵網(wǎng))的識別,哪種方法更適用還未有相關(guān)研究?;诖?,本研究使用 2 m 分辨率的 GF-1 融合影像,分別使用 PSPNet,DeepLabv3+ 識別在建生產(chǎn)建設(shè)項目中的防塵網(wǎng),并對比分析 2 種方法的優(yōu)劣及識別結(jié)果精度,從而篩選出最優(yōu)方法,旨在提出一種在建生產(chǎn)建設(shè)項目防塵網(wǎng)遙感監(jiān)管的新模式。
本研究以山東省濟南市生產(chǎn)建設(shè)項目分布較為集中的區(qū)域作為研究對象。研究區(qū)位于 36°40′N,117°00′E,占地面積為 10 244 km2,地處魯中南低山丘陵與魯西北沖積平原的交接帶,海拔高度為 5.0~1 108.4 m,屬暖溫帶半濕潤季風(fēng)氣候,雨熱同季,年降水量為 550~950 mm,7—9 月降水量約占年降水總量的 60%,年平均氣溫為 11~14℃。土壤類型為顯域性棕壤、褐土,以及隱域性潮土、砂姜黑土、水稻土、風(fēng)砂土 6 個土類,地表土質(zhì)疏松易發(fā)生水土流失[9]。近幾年,隨著濟南市經(jīng)濟迅速發(fā)展、城市化進程的加快,城鎮(zhèn)建設(shè)、公路、供水、輸變電等生產(chǎn)建設(shè)活動頻繁劇烈,嚴(yán)重破壞地表植被,水土流失頻發(fā)。
遙感影像采用高分一號衛(wèi)星(GF-1)影像,該衛(wèi)星搭載 2 臺多光譜傳感器(2 m 分辨率全色/8 m分辨率)和 4 臺多光譜寬幅傳感器(16 m 分辨率),多光譜傳感器包括藍(lán)、綠、紅和近紅外 4 個通道。本研究獲取的是 2017 年 6—9 月的 GF-1 影像,該時期擾動地塊與其他地物的差異較為明顯,利于進行生產(chǎn)建設(shè)項目防塵網(wǎng)的提取。數(shù)據(jù)預(yù)處理包括輻射定標(biāo)、大氣校正、幾何校正、融合(全色和多光譜波段)、鑲嵌及裁剪等步驟。
遙感影像通過空間位置的不同及灰度值的差異表示不同地物的差異,這是區(qū)分影像中不同地物的物理基礎(chǔ)。對象特征分析是基于高分遙感影像開展信息提取分析的首要環(huán)節(jié)。防塵網(wǎng)在影像中具有以下共性特征:1)光譜特征。防塵網(wǎng)在綠波段均有較高的反射率,與其背景環(huán)境差異明顯,使用的光譜特征為 Mean,Brightness,Max。2)幾何特征。防塵網(wǎng)整體形狀較為規(guī)則,網(wǎng)格邊緣清晰,使用的幾何特征為 Asymmetry,Border index,Compactness,Shape index。3)紋理特征。圖斑內(nèi)防塵網(wǎng)紋理分布較為均勻,使用的紋理特征為 GLCM_Con,GLCM_Asm。防塵網(wǎng)遙感影像和部分實地照片如圖 1 所示,因防塵網(wǎng)實地照片相似,故選 3 張典型實體照片作為示意。
將 GF-1 影像多光譜波段(紅、綠、藍(lán)波段)和全色波段融合生成的遙感影像作為基礎(chǔ)數(shù)據(jù),采用人機交互的標(biāo)注方式,獲取海量防塵網(wǎng)樣本,此過程共生成 1 153 個樣本。
1)樣本數(shù)據(jù)獲取。深度學(xué)習(xí)是高度數(shù)據(jù)依賴型算法,其性能往往隨著數(shù)據(jù)量的增加而不斷增強,樣本數(shù)據(jù)是制衡最終提取效果的決定因素之一[10]。針對防塵網(wǎng)的特定位置信息,在濟南市 2017 年高分影像上獲取影像數(shù)據(jù)。
2)樣本標(biāo)注。防塵網(wǎng)的檢測需求是確定其位置、面積和形狀。通過人機交互方式,根據(jù)防塵網(wǎng)在影像的實際形狀進行標(biāo)記。對所有標(biāo)注的樣本進行校驗,并對邊界標(biāo)記不準(zhǔn)確、標(biāo)注錯誤及其遺漏標(biāo)記的樣本進行修正。
3)野外調(diào)查。針對不同表現(xiàn)特征的生產(chǎn)建設(shè)項目防塵網(wǎng)開展外業(yè)調(diào)查工作,共完成 80 個調(diào)查。
4)樣本裁切。由于 GPU 內(nèi)存有限,模型輸入圖像尺寸受限,需要將圖像裁剪為 512 像素×512 像素的切片圖像。
圖 1 防塵網(wǎng)示意圖
5)數(shù)據(jù)增強。為達(dá)到較好的訓(xùn)練效果,需進行樣本增強,實現(xiàn)網(wǎng)絡(luò)參數(shù)的調(diào)優(yōu)。數(shù)據(jù)增強的方法包括以下 3 種:a.將影像及標(biāo)簽數(shù)據(jù)分別旋轉(zhuǎn)不同角度(30°,60°,90°,120°,150°,180°,210°,240°,270°);b.對影像及標(biāo)簽數(shù)據(jù)做鏡像處理(上下、左右);c.對影像及標(biāo)簽數(shù)據(jù)做模糊處理(左上、左下、右上、右下、中心)。經(jīng)過數(shù)據(jù)增強后,生成最終的樣本集,并將其以 8∶2 的比例隨機分為訓(xùn)練集與驗證集。
基于融合影像的不同尺度數(shù)據(jù),分別使用DeepLabv3+ 和 PSPNet 進行訓(xùn)練,識別生產(chǎn)建設(shè)項目防塵網(wǎng)信息。
3.2.1 DeepLabv3+
DeepLabv3+ 模型把 ASPP 模塊應(yīng)用 Encoderdecoder 網(wǎng)絡(luò)執(zhí)行語義分割任務(wù)[11]。在編碼階段,首先應(yīng)用 ResNet 網(wǎng)絡(luò)提取原圖像特征,在 Xception 網(wǎng)絡(luò)中引入 ASPP 模塊,在多個比率、視野范圍上,通過深度卷積網(wǎng)絡(luò)得到圖像級特征圖,利用池化操作編碼多尺度的上下文信息,探測多尺度下的卷積特征,解決物體魯棒分割問題[12]。由于 ASPP 方法參考了遙感影像不同尺度的特征圖,并且空洞卷積的使用加強了提取稠密特征的能力,因此該結(jié)構(gòu)具有可以提取遙感影像高層特征的優(yōu)點,但是該方法存在池化和有步長的卷積,導(dǎo)致遙感影像的邊界信息嚴(yán)重丟失[13-15]。
因此,在解碼器階段,借鑒 FCN 的跳步連接方式,連接低層和高層特征,修復(fù)遙感影像尖銳邊界的問題。其中,通過低層次特征的引入增強影像特征非線性表達(dá)能力,有效緩解 DeepLabv3+ 模型在小尺度防塵網(wǎng)目標(biāo)提取方面所出現(xiàn)的孔洞問題。利用 48 通道 1×1 卷積對低層次特征圖卷積,再融入ASPP 采樣的高層次特征圖,從而實現(xiàn)模型更好的優(yōu)化。基于 DeepLabv3+ 模型的遙感影像分類識別框架如圖 2 所示。
圖 2 基于 DeepLabv3+ 模型的遙感影像分類識別框架圖
3.2.2 PSPNet
PSPNet 采用空間金字塔網(wǎng)絡(luò)結(jié)構(gòu),不僅增強了多尺度信息的融合,而且減小了局部和全局的損失。該結(jié)構(gòu)是一種綜合多尺度場景的網(wǎng)絡(luò)架構(gòu),包括卷積層和金字塔池化 2 個部分,具有多方面的優(yōu)勢,不僅架構(gòu)簡單,而且靈活性強。其中,卷積層集成了不同的經(jīng)典網(wǎng)絡(luò)架構(gòu),如 AlexNet,VGGNet,GoogleNet 和 ResNet等,實現(xiàn)從低層到高層特征的逐步抽象。金字塔池化部分提供優(yōu)于像元場景解析的全局上下文關(guān)系,對卷積層模塊最后1 層抽象特征進行多尺度的池化和卷積,并將多尺度池化/卷積特征進行上采樣到卷積層最后一層,判定每 1 個像元類型的歸屬,實現(xiàn)防塵網(wǎng)全局到局部的細(xì)節(jié)信息[16-17]?;?PSPNet 模型的遙感影像分類識別框架如圖 3 所示。
圖 3 基于 PSPNet 模型的遙感影像分類識別框架圖
結(jié)果優(yōu)化主要是針對檢測結(jié)果中的孔穴、孤島、分離圖斑等影響分類結(jié)果和精度的噪聲問題,應(yīng)用形態(tài)學(xué)優(yōu)化算法,實現(xiàn)消除噪聲、填補孔穴、合并圖斑的效果,在最大程度保留影像信息的同時進行分類結(jié)果的形態(tài)優(yōu)化。根據(jù)目標(biāo)大小及檢測影像分辨率,在檢測結(jié)束后,對結(jié)果矢量像元數(shù)小于一定閾值的圖斑過濾,減少部分小圖斑對統(tǒng)計結(jié)果的干擾。
3.4.1 評價方法
3.4.1.1 評價對象
遙感影像中防塵網(wǎng)分布及遮擋情況的差異對于其識別具有不同程度的難度,本研究采用不同難易程度的場景(Ⅰ,Ⅱ)作為評價對象,分別采用DeepLabv3+ 和 PSPNet 提取場景Ⅰ,Ⅱ 防塵網(wǎng)邊界,綜合全面評價這 2 種方法對防塵網(wǎng)識別的適用性。場景Ⅰ較簡單,其色差明顯、邊緣清晰、圖斑內(nèi)顏色分布較為均勻;場景Ⅱ較難,防塵網(wǎng)與其背景環(huán)境差異較小,紋理不明顯且顏色與植被相近,具體對比如圖 4 所示。
圖 4 不同場景下的防塵網(wǎng)
3.4.1.2 評價基準(zhǔn)
依據(jù)實踐經(jīng)驗和專業(yè)知識,以 2 m 分辨率的遙感影像為數(shù)據(jù)源,通過人工識別的方法提取防塵網(wǎng),并將其作為模型精度評價的基準(zhǔn)分別對 DeepLabv3+和 PSPNet 進行精度評價。
3.4.1.3 評價指標(biāo)
像素級語義分割的評價指標(biāo)主要包括以下 4 個:
1)精確率P。精確率即預(yù)測結(jié)果中正類占總正類的比例,計算公式為
式中:TP為將正類預(yù)測為正類數(shù);FP為將負(fù)類預(yù)測為正類數(shù)。
2)召回率R。召回率是所有正類中被預(yù)測為正類的比例,計算公式為
式中:FN為將正類預(yù)測為負(fù)類數(shù);TN為將負(fù)類預(yù)測為負(fù)類數(shù)。
3)綜合評價指標(biāo)F1。F1是精確率(P)和召回率(R)的加權(quán)調(diào)和平均,是信息檢索領(lǐng)域的常用的一個評價標(biāo)準(zhǔn),可衡量分類器的綜合性能,F(xiàn)1越高說明模型越好,F(xiàn)1計算公式為
4)平均交并比mIoU。mIoU是各類別的IoU(交并比)計算累加后進行平均,可作為全局評價指標(biāo),則mIoU計算公式為
3.4.2 DeepLabv3+ 和 PSPNet 結(jié)果對比分析
選取 2 個不同難易程度的場景,分別采用DeepLabv3+ 和 PSPNet 提取防塵網(wǎng)邊界,并通過語義分割評價指標(biāo)評價其結(jié)果精度,具體如表 1 和 2所示。結(jié)果表明:DeepLabv3+ 模型對于不同場景下防塵網(wǎng)提取結(jié)果的精確率、召回率、F1值及mIoU均優(yōu)于 PSPNet 模型。
表 1 簡單場景下(場景 I)同模型防塵網(wǎng)識別精度
表 2 復(fù)雜場景下(場景 II)不同模型防塵網(wǎng)識別精度
DeepLabv3+,PSPNet 模型對場景Ⅰ,Ⅱ下的防塵網(wǎng)檢測結(jié)果如圖 5 所示。結(jié)合實地考察數(shù)據(jù),對 DeepLabv3+,PSPNet 模型防塵網(wǎng)檢測結(jié)果進行分析可知:三者重合度較高,但與 PSPNet 模型提取結(jié)果相比,DeepLabv3+ 與 2 m 分辨率遙感影像人工目視解譯的結(jié)果更為一致(藍(lán)色為人工標(biāo)注真值,紅色為 DeepLabv3+ 檢測結(jié)果,黃色為 PSPNet 檢測結(jié)果)。進一步對比分析,不難發(fā)現(xiàn) DeepLabv3+分割性能更優(yōu),其分割邊緣光滑,與防塵網(wǎng)實地邊界高度吻合,較人工標(biāo)注結(jié)果邊界更加準(zhǔn)確(場景Ⅰ);對于防塵網(wǎng)與背景環(huán)境區(qū)別相對不明顯,防塵網(wǎng)顏色較淡或與植被顏色相近的情況(場景 Ⅱ),受背景環(huán)境影響存在一定的漏檢和錯檢,就檢測結(jié)果而言,其精度仍優(yōu)于 PSPNet 模型。
圖 5 不同場景下的防塵網(wǎng)檢測結(jié)果對比
對比分析 DeepLabv3+,PSPNet 2 種深度學(xué)習(xí)算法對在建生產(chǎn)建設(shè)項目典型地物目標(biāo)(防塵網(wǎng))識別的適用性,結(jié)果表明:
1)分析不同項目類型、施工階段生產(chǎn)建設(shè)項目水土保持措施布設(shè)的特點及其在遙感影像中的表象特征,發(fā)現(xiàn)防塵網(wǎng)可作為在建生產(chǎn)建設(shè)項目識別的重要地物類型。
2)基于 GF-1 遙感影像,分別采用 DeepLabv3+和 PSPNet 方法識別防塵網(wǎng),結(jié)果表明 DeepLabv3+模型對不同場景下防塵網(wǎng)的整體提取結(jié)果均優(yōu)于PSPNet 模型。DeepLabv3+ 分割性能較好,其分割邊緣光滑,與防塵網(wǎng)實地邊界吻合度高。與專家解譯的結(jié)果相比,解譯結(jié)果邊界基本一致。
3)后續(xù)需要針對不同區(qū)域海量的遙感數(shù)據(jù)構(gòu)建大量的樣本集,通過深度學(xué)習(xí)模型訓(xùn)練精度較高的檢測模型,可用于全國生產(chǎn)建設(shè)項目監(jiān)管工作。