曾慶旺,董張玉,3*,楊學志,種法亭
1.合肥工業(yè)大學計算機與信息學院,合肥 230031;2.工業(yè)安全與應急技術安徽省重點實驗室,合肥 230031;3.智能互聯(lián)系統(tǒng)安徽省實驗室,合肥 230031;4.合肥工業(yè)大學軟件學院,合肥 230031
合成孔徑需達干涉測量(interferometric synthetic aperture radar,InSAR)作為一種先進的微波遙感測量技術,在遙感與測繪領域取得了巨大成就和貢獻(Massonnet 和Feigl,1998),其工作原理是測量從空間相同但時間不同的位置獲取的兩個獨立的合成孔徑雷達(synthetic aperture radar,SAR)圖像之間的干涉相位(Ferretti 等,2007)。不可避免地,干涉相位噪聲由以下3 類因素引入(Xu 等,2020):1)系統(tǒng)噪聲,如熱噪聲和 SAR 散斑噪聲;2)去相干問題,包含基線、時間和空間去相干;3)信號處理誤差,主要涉及配準錯誤。噪聲的存在增加了相位解纏的難度甚至導致其過程失敗,嚴重干擾了最終的干涉測量結果。因此,干涉相位去噪是干涉測量處理中的必要步驟,已發(fā)展成為一項重要技術。
現(xiàn)有的相位去噪方法可以分為空間域、變換域和深度學習3 類方法。傳統(tǒng)空域濾波算法使用滑動窗口獲得圖像局域統(tǒng)計特征進行濾波處理,從而達到去除噪聲的目的。目前Lee 濾波算法(Lee 等,1998)作為一種經(jīng)典的空域去噪方法,根據(jù)局部噪聲統(tǒng)計和方向相關的窗口自適應地濾除沿條紋的噪聲。在Lee 濾波算法的基礎之上,其改進版本(Fu等,2013)具有一個自適應濾波器窗口,其方向和高寬也可以隨圖像自適應變化。傳統(tǒng)空域濾波算法試圖通過自適應窗口處理來增加保留相位細節(jié)的能力,但窗口處理操作可能會由于過度平滑而導致條紋細節(jié)丟失,并且花費大量的處理時間。作為一種新的空域方法,NL-InSAR(non-localinterferogram estimator)方法(Deledalle 等,2011)結合了最大似然估計和非局部思想,利用圖像子塊間的相似性和圖像中的結構信息,從而能夠在穩(wěn)定去噪的同時在紋理細節(jié)保持上取得提升,此外非局部方法突破了搜索相似點的區(qū)域限制,可以在全局內(nèi)尋找可用于濾波的像素,提高了濾波的質(zhì)量,是近年來優(yōu)秀的空域濾波算法,但是它在執(zhí)行過程中多次迭代,效率略低。
變換域去噪方法通常分為頻域和小波域方法。頻域濾波基本思想是假設干涉相位與噪聲分布于不同的頻帶。Goldstein 濾波算法(Goldstein 和Werner,1998)是第一種干涉相位頻域濾波方法,由于濾波參數(shù)強烈依賴經(jīng)驗而定,具有很強的主觀性,其改進版本通過對濾波參數(shù)(Li 等,2008)、自適應窗口大?。⊿uo 等,2016)等提供更適度的估計,實現(xiàn)了一些濾波性能提升。但這一類頻域方法受滑動窗口大小和濾波參數(shù)的影響較大,且有過度平滑的趨勢,圖像的細節(jié)信息保持度不穩(wěn)定。小波變換是一種具有良好的時頻分析和多分辨率特性的方法,Lopez-Martinez和Fabregas(2002)提出了一種復域小波域濾波器,能有效分離信號中的細節(jié)信息和噪聲。與上述頻域濾波方法比較,小波濾波可以較好地保留干涉條紋,保持圖像的邊緣穩(wěn)定性。InSAR-BM3D(blockmatching 3-D)方法(Sica 等,2018)結合了非局部和小波變換等方法,有效地利用局部和非局部冗余,且 3D 小波變換可以增強相位特征,從而提供更穩(wěn)定的分離噪聲能力。與上述變換域方法相比,可以實現(xiàn)更好的過濾效果,然而大量相似的區(qū)域搜索操作,大幅提高了計算成本。
近年來,深度學習已成功地應用于計算機視覺領域,如圖像分類、目標識別和圖像恢復等任務。更進一步,將深度學習應用于InSAR 干涉相位去噪的研究也開始涌現(xiàn)。例如Mukherjee 等人(2021)提出了一種基于卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)的生成模型GenInSAR(generative CNNbased InSAR phase filter),用于直接學習InSAR 數(shù)據(jù)的分布,以進行相位濾波和相干估計。然而,由于只使用單一大小的卷積核的卷積層和大量使用dropout 層,限制了網(wǎng)絡對相位特征的提取,大幅降低了網(wǎng)絡訓練速度以及去噪效果;Sun 等人(2020)提出了一種結合殘差學習與密集連接(dense connection)的干涉相位去噪網(wǎng)絡DeepInSAR(a deep learning framework for SAR interferometric phase restoration and coherence estimation),利用密集連接可以實現(xiàn)特征重用和緩解梯度消失問題,但由于密集連接進行通道疊加的原因,網(wǎng)絡需要加深且需要頻繁讀取內(nèi)存,拖慢了網(wǎng)絡訓練速度;Pu 等人(2020)提出一種用于InSAR 的具有尺度循環(huán)網(wǎng)絡的相位濾波方法PFNet(phase filtering network);陶立清等人(2023)提出一種結合CNN 與自編碼/解碼器進行非監(jiān)督學習的干涉相位去噪方法。對于上述兩種方法,由于需要對輸入的干涉相位圖進行重采樣或上下采樣,減少了圖像信息的使用,會對去噪結果產(chǎn)生消極的影響。此外,上述深度學習算法常常由于感受野受限,大多只關注局部特征而忽略了全局上下文信息,在特征提取方面仍然存在不少的提升空間?;谶@些問題,本文提出了一種結合全局上下文與融合注意力的干涉相位去噪網(wǎng)絡GCFA-PDNet(global context and fused attention phase denoising network),使用全局上下文不僅關注局部信息,還能提取相位全局信息,又可以使去噪方法具有非局部方法的優(yōu)勢;使用融合注意力增強網(wǎng)絡的特征提取能力,強調(diào)關鍵特征,提取隱藏在復雜背景中的噪聲信息,進而提高網(wǎng)絡的效率和去噪處理的準確性。綜合二者,可以提升網(wǎng)絡的噪聲抑制能力,且保留更多的相位細節(jié),獲得更高精度的結果。
InSAR 干涉相位噪聲可認為是零均值加性噪聲(Lee 等,1998),從而包含隨機噪聲的干涉相位可以表示為
式中,φy表示含噪聲的相位觀測值,φx表示無噪聲的干凈相位,n代表均值為零且標準差為σ的噪聲,且φx、φy、σ三者兩兩獨立。由于三角函數(shù)的周期性,干涉相位被纏繞到(-π,+π]之內(nèi)。此外,纏繞的相位在-π 與+π 之間產(chǎn)生的跳變所代表的高頻信號應該被很好地保留,從而使用自然圖像的去噪方法直接對干涉圖像去噪是不可取的。為了解決這個問題,依據(jù)Wang等人(2016)的策略來處理復數(shù)域中的干涉相位,即將干涉相位拆分為實部與虛部,然后分別進行去噪處理。在復數(shù)域中,干涉相位可以表示為
式中,R為干涉相位的實部,I為干涉相位的虛部,二者可以表示為
本文提出的相位去噪網(wǎng)絡GCFA-PDNet 如圖1所示。網(wǎng)絡主要由4 個全局上下文提取模塊(global context extraction module,GCEM)、4 個融合注意力模塊(fused attention module,F(xiàn)AM)和1 個全局殘差連接組成。首先,使用1 個卷積核大小為3 × 3 的標準卷積,將圖像通道數(shù)升為64,后接激活函數(shù)ReLU(rectified linear units)以提取干涉相位的底層特征。之后,經(jīng)過4 個GCEM,可以充分利用全局上下文信息,獲得更多更豐富的淺層和深層特征。同時,4 個FAM 模塊可以使GCFA-PDNet 更加關注噪聲信息,利于去除噪聲的同時保持原始圖像的細節(jié)。在此之后,將GCEM 與FAM 的輸出拼接,淺層特征與深度特征融合后經(jīng)過若干卷積層輸出。最后,通過全局殘差學習獲得所需要的去噪圖像。
圖1 GCFA-PDNet網(wǎng)絡結構Fig.1 Structure of GCFA-PDNet
對于包含大量干涉條紋和復雜的地面高程或形變信息的干涉相位圖,每個干涉條紋都包含豐富的邊緣信息,且相鄰的干涉條紋常常具有相似性,在去噪任務中需要保持這些豐富的邊緣特征以及在全局信息中識別出各個條紋。此外,干涉相位中的去相干噪聲會阻礙上下文特征的提取。另一個問題是卷積核在每一層的局部感受野內(nèi)融合空間和通道信息來構造特征,由于卷積具有局部感知的特點,只能對局部區(qū)域進行上下文建模,導致感受野受限。因此,簡單堆疊多層卷積層進行建模,不僅計算量大,而且難以優(yōu)化。針對現(xiàn)有的深度學習干涉相位去噪算法存在的以上問題,提出了全局上下文提取模塊,以克服卷積神經(jīng)網(wǎng)絡關注局部特征的缺點,增強所提取特征中全局上下文信息的聚合,對整個輸入特征圖進行全局上下文信息提取,有利于提升網(wǎng)絡的去噪能力和細節(jié)保持能力。全局上下文提取模塊如圖2所示,圖中d后數(shù)字為膨脹卷積的膨脹因子,其最核心模塊是全局上下文模塊(global context block,GC Blcok)。
圖2 全局上下文提取模塊Fig.2 Global context extraction module
為獲取局部特征,首先使用3 × 3 的標準卷積(Conv),后接批量歸一化(batch normalization,BN)和激活函數(shù)ReLU,以防止過擬合。同時,為了挖掘周圍的上下文信息,需要進一步擴大感受野(receptive field,RF)。為此,連續(xù)使用膨脹因子分別為2和3的膨脹卷積,其感受野計算為
圖3 標準卷積與膨脹卷積的感受野的比較Fig.3 Comparison of receptive fields between standard convolution and dilated convolution((a)RF of standard convolution;(b)RF of dilated convolution)
GCBlock(Cao 等,2019)對非局部網(wǎng)絡(nonlocal network)(Wang 等,2018)、壓縮和激勵網(wǎng)絡(squeeze-and-excitation networks,SENet)(Hu 等,2018)兩種方法取長補短。非局部網(wǎng)絡使用自注意力機制建模像素對關系,利用全局其他位置的信息增強當前位置的信息(楊翠倩 等,2021),然而它對于每一個位置學習不受位置依賴的注意力圖(attention map),造成了大量的計算浪費;SENet 使用全局平均池化對不同通道進行權值重標定,用于調(diào)整通道依賴關系,但僅采用權值重標定使其不能充分利用全局上下文信息。所以,結合了兩種方法的GCBlock 不僅能夠像非局部網(wǎng)絡一樣有效地對全局上下文建模,又能夠像SENet 一樣輕量。所以,增加GCBlock 到網(wǎng)絡中,不僅可以獲得更具多樣性的淺層和深層特征,而且能夠提取全局上下文信息,進而在去噪任務中結合非局部方法思想利用全局信息進行去噪,從而提供更穩(wěn)定的分離噪聲能力。
GCBlock 如圖4所示,首先采用1×1卷積和softmax 函數(shù)提取注意力權重,通過矩陣相乘實現(xiàn)注意力建模(context modeling),之后通過在兩個1 × 1卷積之間插入LayerNorm+ReLU 進行特征變換(transform),最后使用殘差連接將全局上下文與每個位置的特征聚合。圖中,C表示特征圖的通道數(shù),H和W分別為特征圖的高和寬,?代表乘法(multiply)。r為通道壓縮比率,設置為4。Layer Normalization 層的作用是在通道維度對相位數(shù)據(jù)進行歸一化,進而可以降低優(yōu)化難度且作為正則化提高泛化性。
圖4 GCBlock網(wǎng)絡Fig.4 GCBlock network
為了進一步平衡去噪和紋理,保留兩者之間的關系,對特征圖進行加權處理,達到增強目標特征和抑制噪聲的目的,受Liu 等人(2022)的啟發(fā),構建了一種融合注意力模塊FAM,如圖5 所示。通過GCEM 所得的特征圖fm經(jīng)過一個1 × 1 的標準卷積后,通道數(shù)降維為原來的一半,然后將其并行送入通道注意力模塊(channel attention block,CAB)和空間注意力模塊(spital attention block,SAB),再將二者輸出拼接,從而保持原始輸入的通道數(shù),最后通過一個標準3 × 3 卷積輸出。FAM 不僅在通道層面提高效率,還可以專注于圖像中的顯著信息,例如去相干嚴重的區(qū)域和干涉條紋邊界,而忽略次要的信息,例如單個條紋內(nèi)部相位梯度緩慢的部分,從而提高去噪的效率和信息處理的準確性。
圖5 FAM模塊結構Fig.5 FAM module structure
2.3.1 通道注意力模塊
CAB方法可以通過獲取每個特征通道的某種權重,并依據(jù)這個權重對當前任務有效和無效的特征分別進行增強和抑制(盧正浩和劉叢,2021),從而利用通道注意力方法可以提高去噪的效率和信息處理的準確性。相較于SENet,Wang 等人(2020)認為捕獲所有通道的依賴關系是低效并且是不必要的,且一維卷積具有良好的跨通道信息獲取能力,基于上述觀點,本文使用的CAB模塊如圖6所示。
圖6 通道注意力模塊Fig.6 Channel Attention Module
首先,將已經(jīng)通道降維的特征圖fm經(jīng)過全局平均池化(global average pooling,GAP)處理,為了在降低模型復雜度的同時,增強網(wǎng)絡的跨通道信息的獲取能力,使用一維卷積(Conv1D)替代SENet 中的兩次全連接。對于一維卷積,其卷積核大小為k的計算式為
式中,C為輸入一維卷積的輸入通道數(shù),w和b為常數(shù),分別是預設權重與偏置,一般設置為w=2、b=1,|x|odd表示為最接近x的奇數(shù)。之后用sigmoid 對1 維卷積的輸出進行非線性激活。最后將激活后的特征圖與fm相乘,得到CAB 模塊的輸出fCA,即實現(xiàn)通道注意力。
2.3.2 空間注意力模塊
因為受真實空間地形影響,干涉相位不同區(qū)域的噪聲分布可能不均勻,使用SAB 使網(wǎng)絡更專注于具有更多有用信息的特征,例如失相干嚴重的像素和高頻率干涉條紋區(qū)域,從而提取更豐富的特征,利用這些特征增強網(wǎng)絡對噪聲的抑制能力并獲得不俗的相位細節(jié)保持能力。受Liu 等人(2021)的啟發(fā),構建的SAB如圖7所示。
圖7 空間注意力模塊Fig.7 Spatial attention module
在SAB中,為了關注空間信息和減少計算參數(shù),使用兩個卷積核大小自適應變化的卷積層進行空間信息融合。其中,通道縮減比r設置為4,卷積核大小k隨FAM 使用次數(shù)n而變化。即k=2n-1,n=1,2,3,4。相較于傳統(tǒng)的空間注意力機制,由于最大池化操作減少了信息的使用,產(chǎn)生了消極的影響,這里刪除了池化操作以進一步保留特性映射。輸入fm,通過SAB后,其大小與尺寸保持不變,即
式中,conv1,conv2 分別代表輸出通道數(shù)為C/r、C的標準3 × 3 卷積。最后,輸入特征fm元素乘以獲得的權重,獲得SAB模塊輸出。
殘差連接(He 等,2016)旨在解決非常深的神經(jīng)網(wǎng)絡上的性能退化問題,在本文中,利用全局殘差連接來預測實部和虛部通道的殘差。所提出的模型被訓練來預測殘差,而不是直接輸出估計干凈成分,故圖1 中最后一個卷積層的輸出為干涉相位的噪聲映射。將殘差相位設為ri,原始噪聲相位設為yi,原始無噪聲相位設為xi,則網(wǎng)絡獲得的殘差相位ri可以表示為
根據(jù)本文所提出的噪聲模型即式(1),此時網(wǎng)絡學習的目的在于找到函數(shù)H(yi;w),w為網(wǎng)絡可訓練的權重參數(shù),使得訓練結果可以估計殘差相位ri,則有
對于批量樣本數(shù)量為N的訓練樣本的干涉相位實部和虛部通道,采用均方誤差(mean square error,MSE)作為損失函數(shù),具體為
式中,wr|i為網(wǎng)絡對干涉相位實部或虛部的訓練參數(shù)。和分別為干涉相位實部或虛部的原始噪聲相位和原始無噪聲相位。
實際中,InSAR 干涉相位圖缺乏無噪聲的真實數(shù)據(jù),而網(wǎng)絡訓練通常需要大量標記樣本,因此采用模擬干涉相位圖像作為訓練集,以驗證所提出方法的有效性并評估其性能。實驗在Sun 等人(2020)的模擬數(shù)據(jù)集上進行,其優(yōu)勢是模擬了不規(guī)則形變信號和地面反射現(xiàn)象以及非平穩(wěn)噪聲條件。實驗使用該數(shù)據(jù)集中的9 種不同配置,通過組合3 個不同水平的加性白高斯噪聲(SL、SM、SH,即噪聲標準差分別為0.1、0.2、0.3)和相位條紋的3 個頻率(FL、FM、FH)來代表其中某一種噪聲類型數(shù)據(jù)。例如,具有低水平噪聲、高條紋頻率的數(shù)據(jù)集,用SL-FH 表示。在實驗中,對于每種噪聲類型,生成了 100個隨機樣本,每個樣本的圖像分辨率為 1 024 × 1 024 像素。其中一半用于訓練,其余用于測試。通過在所有9 個數(shù)據(jù)集上使用無噪聲圖像訓練單個模型,評估GCFA-PDNet模型的學習能力和泛化能力。
實驗在10.0.130 版 本CUDA、7.6.5 版 本CUDNN、Intel Xeon Silver4144 @2.2 GHz 處理器,Nvidia Tesla P100(16 GB)顯卡環(huán)境下進行。采用的框架為Tensorflow1.14,網(wǎng)絡參數(shù)更新采用Adam 優(yōu)化器,網(wǎng)絡每次訓練的樣本數(shù)為64,初始學習率設為0.001,并且每4 000個迭代輪次(epoch)學習率大小下降一半,共訓練16 000 個迭代輪次,訓練完成單個子數(shù)據(jù)集需要2 h。
對于模擬干涉相位圖像的實驗,選擇峰值信噪比(peak signal-to-noise ratio,PSNR)和結構相似性(structural similarity,SSIM)作為評價指標,越大的PSNR說明濾波后的相位與干凈的相位的差距越小,然而它沒有考慮圖像中各像素間的相關性。因此,為了評價去噪圖像的整體去噪質(zhì)量,采用SSIM 來評估過濾后的圖像的結構相似性。更高的SSIM 意味著在過濾過程中相位結構信息得到更好的保留。對于SSIM 指標,其范圍為[0,1],值越大表示結構信息保留得越好。
對于真實的干涉相位,由于不存在無噪圖像做參考,從而無法使用上述兩種指標來評價去噪性能。除了在視覺上主觀評判真實干涉相位圖像去噪性能,還可以使用殘差點數(shù)(number of residues,NOR)與相位標準偏差(phase standard deviation,PSD)作為客觀評價指標。NOR 可以反映濾波方法抑制噪聲的能力。濾波后的干涉相位的 NOR 越小,抑制噪聲的能力越強。殘差點的定義取決于相位梯度在2 × 2像元形成的最小閉合路徑積分。對于干涉相位圖像,相鄰像素之間的相位梯度的計算式為
式中,i和j分別代表相位數(shù)據(jù)行、列方向上的序號;r和a代表距離向(range)、方位向(azimuth)對應行、列方向。這兩個方向上,相鄰樣本數(shù)據(jù)差的纏繞值可作為連續(xù)相位梯度。wrap代表相位纏繞操作,即將{ }內(nèi)的值限定在(-π,+π]內(nèi),其定義為
對于給定的一個像素點(i,j),其是否為殘差點的判定式為
若Q不等于0,則該點為殘差點。此外PSD可用來衡量噪聲分布的離散程度。PSD 的數(shù)學表達式為
式中,w為檢測樣本窗口,φi,j為窗口內(nèi)各點相位值,為窗口內(nèi)相位均值,N為窗口內(nèi)樣本個數(shù)。PSD值越小,噪聲分布越集中,干涉圖質(zhì)量越好。
對上述測試數(shù)據(jù)進行實驗,并將模擬數(shù)據(jù)中的5 類測試圖像進行對比,展示所有模擬數(shù)據(jù)的實驗評價指標。選擇Goldstein、NL-InSAR、InSARBM3D、DeepInSAR和PFNet方法進行對比實驗。
表1 和表2 展示了上述方法與所提出的方法在9 種不同失真條件下獲得的平均PSNR 和平均SSIM指標。由表中可知,所提出的方法在9 種不同類型的噪聲數(shù)據(jù)下均取得了很好的效果,獲得的平均PSNR相較于Goldstein、NL-InSAR、InSAR-BM3D、DeepInSAR 和PFNet 分別高出7.30 dB、6.21 dB、4.22 dB、1.64 dB 和1.45 dB,SSIM 值也優(yōu)于其他算法。表明GCFA-PDNet 在增強去噪能力的同時,可以更好地保持相位結構信息,即條紋邊緣等細節(jié)信息會更加清晰。
表1 9種類型的相位數(shù)據(jù)去噪后的PSNRTable 1 PSNR of 9 types of phase data after denoising/dB
表2 9種類型的相位數(shù)據(jù)去噪后的SSIMTable 2 SSIM of 9 types of phase data after denoising
Goldstein 與NL-InSAR 兩種去噪方法在低噪聲水平下PSNR 指標都表現(xiàn)不俗,但與深度學習去噪方法對比仍有一定差距,隨著噪聲水平提高,二者的指標都劇烈下降,差距進一步擴大。在同一噪聲水平條件下,從SSIM 指標可以看出,它們的數(shù)值低于其他算法,隨著相位條紋頻率的增加,二者下降幅度大于其他算法,表明它們并沒有良好的結構保持能力;InSAR-BM3D 相較于前兩種非深度學習方法,在中、低水平的失真條件下有著較大提升,然而隨著噪聲水平或條紋頻率的提高,也出現(xiàn)了評價指標較大幅度的下降。對比另外3 種深度學習方法,在低噪聲水平的條件下,GCFA-PDNet 相對于PFNet 和DeepInSAR 有一些提升,隨著噪聲水平的提高,前者的兩種評價指標沒有后二者下降的幅度大,在相位條紋的中、高頻率條件下,GCFA-PDNet 有著更加優(yōu)秀的表現(xiàn),說明其具有更強的泛化能力。通過統(tǒng)計分析證明,所提出方法可以在有效去除噪聲的同時,有效地保持結構信息。
圖8 展示了在同一相位條紋頻率(FM)條件下,不同噪聲水平(SL、SM、SH)的3 種噪聲數(shù)據(jù)的去噪結果。其中,第1、2、3 行分別代表SL-FM、SM-FM 與SH-FM類型數(shù)據(jù)的處理結果。藍色—紅色代表相位變化由-π~+π。
圖8 SL-FM、SM-FM與SH-FM類型數(shù)據(jù)的處理結果Fig.8 The processing results of SL-FM,SM-FM and SH-FM type data((a)ground truth;(b)noisy-images;(c)Goldstein;(d)NL-InSAR;(e)InSAR-BM3D;(f)DeepInSAR;(g)PFNet;(h)ours)
圖9 展示了在同一噪聲水平(SM)條件下,不同相位條紋頻率(FL、FM、FH)的3 種噪聲數(shù)據(jù)的去噪結果。第1、2行分別代表SM-FL 與SM-FH 類型數(shù)據(jù)處理后的結果。
圖9 SM-FL與SM-FH類型數(shù)據(jù)處理后的結果Fig.9 The processing results of SM-FL and SM-FH type data((a)ground truth;(b)noisy-images;(c)Goldstein;(d)NL-InSAR;(e)InSAR-BM3D;(f)DeepInSAR;(g)PFNet;(h)ours)
結合對表1、表2 的定量與對圖8、圖9 的定性分析可知,在同一相位條紋頻率條件下,隨著噪聲水平的提高,各種方法的去噪效果出現(xiàn)不同程度下降;在同一噪聲水平的條件下,隨著相位條紋頻率的提高,各種方法的去噪效果也出現(xiàn)不同程度下降。由此可見,干涉相位噪聲水平和相位條紋頻率是影響去噪的關鍵因素。
在同一相位條紋頻率(FM)下,結合圖8 可知,Goldstein 雖然有良好的去噪性能,但是得到的圖像不夠清晰,在圖像細節(jié)方面,隨著噪聲水平提升,紋理失真與邊界偽影明顯,在某些區(qū)域的邊緣,無法保持原來的結構信息。NL-InSAR 在中、低噪聲水平條件下,去噪效果與細節(jié)保持相較于Goldstein 有所提升,隨著噪聲水平提升,其去噪能力削弱得也比較明顯。InSAR-BM3D 的去噪效果相較于前兩種方法有較大提升,然而在高噪聲水平下其細節(jié)保持能力弱于另外3 種深度學習算法。相較于前面3 種非深度學習去噪算法,DeepInSAR 在去噪和紋理保持方面都有較大提升,但在局部條紋邊緣仍然存在少量的失真。對于PFNet,與DeepInSAR 相比,其去噪效果展現(xiàn)出略微提升,在這3 種深度學習算法中可以發(fā)現(xiàn)GCFA-PDNet 處理圖像的整體效果最佳,GCFAPDNet 在保持去噪性能時,也表現(xiàn)出了更好的細節(jié)保留效果,相位條紋的邊緣更加清晰。
在同一噪聲水平(SM)下,結合圖8 第2 行與圖9,Goldstein、NL-InSAR 和InSAR-BM3D 3 種方法隨著相位條紋頻率的提升,去噪效果出現(xiàn)不同程度的明顯下降,如殘留噪聲增多、邊緣變得更加模糊以及邊界偽影增多等;在中、高相位條紋頻率的條件下,深度學習方法的優(yōu)勢得以體現(xiàn),3 種深度學習方法均取得了不俗的效果,但它們之間仍然存在細微的差別,通過對比圖9(f)(g)(h)第1 行可以看出,GCFA-PDNet 具有更好的邊緣保持能力,PFNet 和DeepInSAR 均存在將部分噪聲點誤判為條紋邊緣的現(xiàn)象,通過對比圖9(f)(g)(h)第2 行可以看出,GCFA-PDNet 達到了最佳的去噪效果,PFNet 仍存在少量邊界偽影,而DeepInSAR 則在圖像的邊界出現(xiàn)了少量失真。綜合上述對比分析,在中、高水平相位條紋頻率或噪聲水平的條件下,圖像所包含的特征與結構信息更加豐富,GCFA-PDNet 使用了全局上下文提取模塊與融合注意力模塊,加強了網(wǎng)絡的特征提取能力,并充分使用全局上下文信息進行去噪,且充分利用了網(wǎng)絡的淺層特征和深層特征,從而GCFA-PDNet 比 PFNet 和DeepInSAR 在去噪性能方面有所提升,且在紋理保持方面,GCFA-PDNet 的表現(xiàn)更好,具有更加穩(wěn)定的細節(jié)保持能力,去噪結果最清晰,取得了最優(yōu)的性能。
對于真實干涉相位,由于不存在無噪圖像做參考,故無法測得其噪聲水平。干涉圖的相干性是顯示干涉相位可靠性的關鍵指標(Deledalle 等,2011),相干值越大,干涉圖質(zhì)量越好。為了進一步驗證所提出方法的性能,在沒有多視處理的條件下,在由ENVISAT-ASAR(Bam,Iran)數(shù)據(jù)生成的干涉圖中,裁剪出兩幅尺寸為1 000 × 1 000(方位向×距離向)的圖像作為測試樣本,如圖10(a)所示,其中,區(qū)域Ⅰ、Ⅱ分別為高、低相干區(qū)域,二者平均相干系數(shù)分別為0.76 和0.43,圖10(b)是其相干系數(shù)圖,相干系數(shù)范圍為0(黑)到1(白)。
圖10 測試樣本Fig.10 Test sample((a)ensemble of the Interference graph;(b)coherence coefficient plot)
對于定性評估,區(qū)域Ⅰ、Ⅱ去噪結果及其細節(jié)圖如圖11 所示。綜合這兩個區(qū)域的實驗結果可知,在高相干性的條件下,各種方法都取得了不錯的效果,然而綜合去噪與細節(jié)保持能力,GCFA-PDNet 取得了最好的效果。在低相干性條件下,Goldstein 和NL-InSAR 的噪聲抑制能力不足,保留了更多的噪聲,InSAR-BM3D 相較于前二者有所提升,但出現(xiàn)了過度平滑的趨勢;DeepInSAR 的結果過于平滑,丟失了大量微小細節(jié),PFNet 雖然保留了更多細節(jié)但也殘留了更多的噪聲,圖像整體質(zhì)量稍差,而所提出方法在去噪能力和細節(jié)保持方面達到更好的平衡,在3種深度學習方法中取得了最優(yōu)表現(xiàn)。
圖11 區(qū)域 Ⅰ、Ⅱ的去噪結果Fig.11 Denoising results of regions I and Ⅱ((a)noisy-images;(b)Goldstein;(c)NL-InSAR;(d)InSAR-BM3D;(e)DeepInSAR;(f)PFNet;(g)ours)
為了驗證上述定性分析,計算了圖11 的定量評價指標NOR。此外,由于部分殘差點無法完全過濾,計算了殘差點減少的百分比(percentage of residual point reduction,PRR),以更清楚地顯示噪聲抑制能力,結果如表3 所示??梢园l(fā)現(xiàn),在高、低相干區(qū)域,Goldstein 和NL-InSAR 方法去噪表現(xiàn)最差;在高相干區(qū)域,InSAR-BM3D 與深度學習方法差距進一步縮小,然而在低相干區(qū)域其去噪能力的不足便體現(xiàn)出來;對比3 種深度學習方法的評價指標,在去噪能力、相位質(zhì)量方面,GCFA-PDNet 相對于其他二者均有提升。結合定性與定量分析,可知所提出的方法在5 種方法中達到了去噪與結構保持能力之間的最佳平衡,具有更好的魯棒性。綜合上述分析,GCFA-PDNet 更適用于低相干性區(qū)域、高相位條紋頻率的干涉相位圖像,即在實際情況中,對于地形復雜或地表形狀快速變化的區(qū)域進行去噪,本文方法具有獨特優(yōu)勢。
表3 真實數(shù)據(jù)在不同方法處理后的評價指標Table 3 Evaluation indicators of real data processed by different methods
本文設計了一種結合全局上下文和融合注意力機制的干涉相位去噪網(wǎng)絡,將全局上下文提取模塊融合注意力模塊應用于干涉相位去噪,具體結論如下:1)全局上下文提取模塊具有強大的特征提取能力,使用該模塊去噪具有非局部方法的優(yōu)勢,實驗表明其取得了顯著改進的去噪結果。2)融合注意力模塊不僅增強了網(wǎng)絡的特征表達能力,更使網(wǎng)絡加強了對相位結構、噪聲的關注。融合上述兩個模塊獲取的深層與淺層特征結構能夠被網(wǎng)絡最大限度地使用,從而達到最優(yōu)的去噪結果。
在未來的工作中,為了應對真實干涉相位的復雜噪聲,可以考慮使用生成對抗網(wǎng)絡模擬更接近真實的干涉相位圖像噪聲,提高噪聲的質(zhì)量,以訓練更強大的模型去噪能力。