摘 要:水域圖像分割常應用于洪災監(jiān)測、地表水資源勘察等工作。合成孔徑雷達(Synthetic Aperture Radar,SAR)圖像常常帶有陰影和干擾斑,導致現(xiàn)有的水域分割結(jié)果容易出現(xiàn)水域連通性差、水域邊緣粗糙等問題。為了更好地利用目標的邊緣信息解決這些問題,分別獨立采用語義分割和超像素分割得到水域預測結(jié)果與超像素聚類掩碼,利用假設(shè)檢驗模型融合2 種方法的分割結(jié)果。在UNet、SegNet、DeepLabV3+和超像素圖卷積網(wǎng)絡(Superpixel Graph Convolutional Network,SGCN)4 種語義分割方法進行實驗,分割精度均有提升。在UNet 上提升最大,平均交并比(mean Intersection over Union,mIoU) 由78. 24% 提升至83. 39% 。對比了3 種不同的超像素分割方法的改善效果,實驗結(jié)果表明,所提方法在線性譜聚類(Linear Spectral Clustering,LSC) 中表現(xiàn)最佳。
關(guān)鍵詞:超像素;假設(shè)檢驗;合成孔徑雷達圖像;水域分割;超像素分割
中圖分類號:TN957. 52 文獻標志碼:A
文章編號:1003-3106(2024)12-2895-07
0 引言
水域在區(qū)域陸地水循環(huán)中發(fā)揮著巨大的作用,是大自然水循環(huán)中不容忽視的重要載體,水域分布對整個區(qū)域生態(tài)系統(tǒng)的未來具有舉足輕重的影響。準確而全面的自然水域分布信息是洪災監(jiān)測及災后評估、水資源調(diào)查、水利工程修建、未來水資源規(guī)劃等工作的必備數(shù)據(jù)[1]。然而水域衛(wèi)星遙感圖像處理方面還存在很多挑戰(zhàn),對地理信息分析構(gòu)成一種制約[2]。在淡水資源短缺、洪澇災害頻發(fā)的嚴峻情況下,發(fā)展更加準確、全面、快速的遙感圖像水域分割算法已經(jīng)越來越重要[3]。如果可以直接在合成孔徑雷達(Synthetic Aperture Radar,SAR)圖像上得到準確的水域分割圖,不僅可以明確水資源的分布情況,為未來社會發(fā)展、自然資源規(guī)劃打下堅實基礎(chǔ),還能在緊急情況下實時監(jiān)測河流、湖泊的變化,預防特大洪澇災害的發(fā)生,盡可能地減少災害帶來的損失。對構(gòu)建良好河流生態(tài)系統(tǒng)、預防多發(fā)的洪水自然災害有著重要作用。
深度學習技術(shù)的發(fā)展推動了語義分割預測精度的提高。語義分割算法能夠通過逐像素分類的方式對圖像進行分割,已經(jīng)應用到遙感衛(wèi)星圖像中,并且能在計算資源約束的情況下和對實效性要求較高的前提下取得較好的效果。但是這種基于深度學習的語義分割方法只能得到目標的主體部分,難以分割出目標的精確輪廓[4],并且十分依賴數(shù)據(jù)集的構(gòu)建[5],尤其是對于復雜的形狀,比如水域SAR 圖像,由于河流、湖泊等水域的邊緣呈現(xiàn)出無規(guī)律的曲折形狀,如何能夠精確分割水域邊界仍然是較大的挑戰(zhàn)。
研究人員提出了很多基于深度學習技術(shù)的分割算法。張金松等[6]通過密集分離卷積和擴展卷積捕獲高維度特征,并利用雙線性插值方法開發(fā)上采樣模塊得到最終結(jié)果,增強了SAR 水域圖像分割的精度和魯棒性。Chen 等[7]通過空洞卷積擴大濾波器視野,實現(xiàn)不增大參數(shù)量的情況下合并更多的上下文信息,并構(gòu)建多孔空間金字塔池對目標進行多尺度分割。戴牧宸等[8]通過減少雙邊分割網(wǎng)絡(BiSeNet)中空間路徑的卷積層數(shù)來使網(wǎng)絡保留更多的原始圖像空間信息,并選用參數(shù)量較小的18 層殘差神經(jīng)網(wǎng)絡(ResNet18)作為模型主干,從而在維持空間信息的同時避免過擬合現(xiàn)象。劉啟等[9]提出了基于先驗信息和UNet 網(wǎng)絡相結(jié)合的SAR 圖像分割算法,借助海陸先驗數(shù)據(jù)庫對分割結(jié)果進行預判,在保證實效性的前提下去除了陰影噪聲的干擾。施卓煒等[10]同時訓練復雜網(wǎng)絡和輕量級網(wǎng)絡2 個分支,通過蒸餾模塊使后者逐漸逼近前者以提高精度,在模型參數(shù)量較低的前提下提高了語義分割效率。趙松璞等[11]采用邊緣提取和灰度化等方式增強輸入圖像,再通過帶有池化層的深度可分離卷積對圖像進行分割,并通過設(shè)計混合注意力機制模塊提取空間位置的大范圍上下文信息,提升了模型捕獲關(guān)鍵特征的能力。Suzuki[12]構(gòu)建了一個使用注意力函數(shù)作為求解器的聚類模塊,并將這個模塊納入到基于神經(jīng)網(wǎng)絡的語義分割模型(如殘差神經(jīng)網(wǎng)絡(ResNet)[13] 和移動窗口全自注意力網(wǎng)絡(SwinTransformer)[14])的下采樣部分。該模型通過聚類模塊對下采樣層的像素進行分組,并通過分層聚類實現(xiàn)圖像分割。
超像素分割是另一種圖像分割方法,利用不同部分在顏色、亮度、紋理等特性上的相似性,實現(xiàn)圖像的分塊聚類過程可以更加充分地利用圖像的紋理信息,得到分割結(jié)果。然而超像素分割過程注重圖像的局部特征,不能充分利用圖像整體信息。
本文利用假設(shè)檢驗的原理將語義分割和超像素聚類結(jié)果融合,從而充分發(fā)揮語義分割的學習優(yōu)勢和超像素提取紋理信息的能力。具體實現(xiàn)路線是:首先獨立完成語義分割和超像素聚類,得到初步分割結(jié)果,然后在每一個超像素塊中通過假設(shè)檢驗原理決定如何選取2 種分割方法的結(jié)果,得到新的預測方案。每個超像素塊中的分割結(jié)果只有3 種,即全部賦值為河流、全部賦值為陸地以及保留語義分割結(jié)果。本文所提方法的優(yōu)勢在于假設(shè)檢驗過程獨立于分割過程,即模型不依賴于某一種分割方法,而是可以靈活組合不同語義分割和超像素方法,選取達到最佳效果的模型;另外本文方法不改變語義分割的下采樣過程,可以繼承現(xiàn)有像素解碼器在提高整體區(qū)域分割精度的優(yōu)勢。以下是本文所提增強方法的技術(shù)路線:
① 采用語義分割模型得到預測掩碼,由0-1 矩陣呈現(xiàn),0 代表非水域即陸地,1 代表水域。
② 使用超像素模型得到聚類結(jié)果,其中第i 個超像素塊所包含的像素點均賦值為i-1。
③ 進入假設(shè)檢驗框架,在每個超像素塊中,所有的像素點都只有水域或非水域2 種標簽中的一個值。分別計算每個超像素塊在語義分割掩碼對應范圍中2 種標簽所占的比例,并與本文的檢驗統(tǒng)計量進行比較,通過決策得到最終的預測結(jié)果。
④ 通過對超像素和假設(shè)檢驗模塊的消融實驗,證明本文所提的方法的可行性;為了獲得更高的準確率,本文還比較了將不同的語義分割模型納入本模型后的分割精度。
1 基于假設(shè)檢驗優(yōu)化的分割模型
1. 1 基本分析
由于語義分割掩碼在像素層面上的離散性質(zhì),并且只有0 和1 兩種標簽(分別代表非水域和水域),本文將其作為假設(shè)檢驗的樣本點。由于超像素聚類的結(jié)果并不是二值的,而是將每個聚類視為不同的類別,本文不能將超像素的標簽作為判定最終分割結(jié)果的依據(jù);超像素的優(yōu)勢在于捕獲圖像紋理信息和邊緣形狀,應該將超像素劃分的邊界作為確定最終分割結(jié)果的參考要素。
本模型將超像素聚類的分塊邊界對應到語義分割掩碼上,形成對掩碼的一個劃分。具體而言,對每個分塊位置上對應的掩碼中標簽為0 和1 的像素的數(shù)量比例進行假設(shè)檢驗,當這個比例超過一個閾值p0 時,說明這個分塊很有可能包含在水域(或非水域)內(nèi)部,故將整個分塊內(nèi)的標簽全部賦值為0 -1中占比更大的標簽;當比例小于p0 時,說明這個分塊很有可能位于水域與非水域的分界線處,這時應該保留語義分割掩碼的標簽值。閾值p0 為已知可變參數(shù),本文通過最大化分割精度的實驗來確定p0的最優(yōu)值。