李勇斌,王 彬,邵高平,邵 帥
(中國人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué),河南鄭州 450001)
水聲通信信號(hào)被動(dòng)探測(cè)是水聲信號(hào)處理領(lǐng)域的重要研究內(nèi)容,在科學(xué)考察和海上救援等民事應(yīng)用以及水下目標(biāo)監(jiān)視等軍事應(yīng)用中發(fā)揮著重要作用.但是,由于海水的聲吸收和海洋環(huán)境噪聲的復(fù)雜多變,遠(yuǎn)距離、海洋環(huán)境噪聲起伏多變條件下的水聲通信信號(hào)被動(dòng)探測(cè)能力明顯下降.解決這一問題的核心是對(duì)接收信號(hào)進(jìn)行降噪,研究既能保留有用信號(hào)本質(zhì)特征又能有效降低環(huán)境噪聲對(duì)有用信號(hào)影響的降噪方法,是提高水聲通信信號(hào)探測(cè)性能的關(guān)鍵環(huán)節(jié).
現(xiàn)有的水聲信號(hào)降噪方法主要是基于信號(hào)處理的方法.對(duì)于高斯白噪聲的降噪方法有基于奇異值分解的降噪方法[1]、基于小波分解的降噪方法[2]、基于經(jīng)驗(yàn)?zāi)B(tài)分解的降噪方法[3]和基于稀疏分解的降噪方法[4]等.其中基于奇異值分解[1]的水聲信號(hào)降噪方法,對(duì)于中高信噪比條件比較有效,當(dāng)信噪比較低時(shí),難以通過奇異值大小來區(qū)分信號(hào)和噪聲成分,且重構(gòu)有效秩階次的選取依賴經(jīng)驗(yàn)知識(shí).基于小波分解的降噪方法[2]和基于經(jīng)驗(yàn)?zāi)B(tài)分解的降噪方法[3]的信號(hào)降噪方法性能受分解層數(shù)和閾值影響大,二者的選取依賴經(jīng)驗(yàn)知識(shí).文獻(xiàn)[4]中提出了一種基于稀疏分解的方法,要求找到合適的過完備原子庫將信號(hào)轉(zhuǎn)換到稀疏域,再通過一定的殘差閾值濾除噪聲成分,但當(dāng)構(gòu)造的稀疏分解字典不匹配時(shí)性能下降嚴(yán)重,且在低信噪比下算法性能不如基于小波分解的降噪方法.對(duì)于淺海脈沖噪聲常用的降噪方法有消隱法[5]、截?cái)喾ǎ?]等,主要通過非線性變換處理對(duì)脈沖的幅度進(jìn)行抑制,在強(qiáng)脈沖和低信噪比條件下降噪性能有限,且非線性變換參數(shù)的選取依賴經(jīng)驗(yàn)知識(shí).綜上所述,現(xiàn)有的基于信號(hào)處理的降噪方法對(duì)低信噪比接收信號(hào)的降噪能力有限,對(duì)于復(fù)雜環(huán)境的適應(yīng)能力不足,而且對(duì)領(lǐng)域知識(shí)和人為經(jīng)驗(yàn)依賴性較強(qiáng).
針對(duì)上述問題,本文提出了一種基于相對(duì)條件生成對(duì)抗網(wǎng)絡(luò)(RCGAN)的水聲通信信號(hào)降噪方法.該方法基于復(fù)雜海洋噪聲環(huán)境的水聲通信信號(hào)接收模型,建立適用于水聲通信信號(hào)降噪的RCGAN 網(wǎng)絡(luò),通過引入擴(kuò)張卷積結(jié)構(gòu),以及選用能夠更好地度量有用信號(hào)與生成信號(hào)分布差異特性的相對(duì)判決損失函數(shù)來對(duì)網(wǎng)絡(luò)進(jìn)行優(yōu)化,提升對(duì)復(fù)雜海洋背景噪聲的降噪能力.針對(duì)不同海洋環(huán)境下水聲通信數(shù)據(jù)稀缺,難以構(gòu)成滿足網(wǎng)絡(luò)訓(xùn)練所需數(shù)據(jù)量,與待測(cè)信號(hào)數(shù)據(jù)具有相同分布的訓(xùn)練數(shù)據(jù)集的問題,本文采用遷移學(xué)習(xí)思想,首先構(gòu)造遷移數(shù)據(jù)模型,產(chǎn)生遷移訓(xùn)練數(shù)據(jù),然后結(jié)合少量目標(biāo)信號(hào)訓(xùn)練數(shù)據(jù),通過兩步訓(xùn)練方法,實(shí)現(xiàn)小樣本條件下對(duì)目標(biāo)信號(hào)的有效降噪.
本文方法以水聲通信接收信號(hào)時(shí)域波形為處理對(duì)象,降噪后保留了信號(hào)的本質(zhì)特征信息,有利于直接對(duì)其進(jìn)行檢測(cè)、識(shí)別等后續(xù)環(huán)節(jié)處理.與傳統(tǒng)方法相比,本文方法適用信號(hào)種類多,對(duì)多進(jìn)制頻移鍵控(M-ary Frequency Shift Keying,MFSK)、多進(jìn)制相移鍵控(M-ary Phase Shift Keying,MPSK)、正交頻分復(fù)用(Orthogonal Frequency Division Multiplexing,OFDM)、線性調(diào)頻(Linear Frequency Modulation,LFM)和直接序列擴(kuò)頻(Direct Sequence Spread Spectrum,DSSS)等常用水聲通信信號(hào)均具有良好的降噪效果,對(duì)環(huán)境的適應(yīng)性強(qiáng),對(duì)低信噪比條件下高斯分布噪聲和海洋脈沖噪聲及水聲多途信道影響均具有一定穩(wěn)健性,對(duì)目標(biāo)信號(hào)訓(xùn)練數(shù)據(jù)量要求低.
水聲通信信號(hào)在水聲信道傳輸過程中會(huì)受到水聲信道的相干多途影響以及海洋環(huán)境噪聲的影響,因此,本文將接收信號(hào)建模為
其中,y(t)表示接收信號(hào);s(t)為發(fā)送的載波調(diào)制信號(hào)或直接序列擴(kuò)頻信號(hào)DSSS,載波調(diào)制類型集合包括MFSK(M=2,4,8)、MPSK(M=2,4,8)、OFDM 和LFM;h(t)表示水聲信道沖激響應(yīng),符號(hào)“?”表示卷積運(yùn)算.為了能夠反映復(fù)雜海洋背景噪聲,本文將噪聲w(t)建模為Alpha穩(wěn)定分布噪聲.
水聲信道,尤其是人類工業(yè)活動(dòng)頻繁和海洋生物密集的淺海水聲信道中,往往存在大量短時(shí)尖峰脈沖噪聲[6].研究表明,Alpha 穩(wěn)定分布可以有效刻畫這類具有顯著拖尾的脈沖噪聲,其特征函數(shù)[7]為
其中,sgn(u)為符號(hào)函數(shù);α為特征指數(shù),用于描述穩(wěn)定分布的脈沖性強(qiáng)弱,α越小,脈沖性越強(qiáng),當(dāng)α=2時(shí)退化為高斯分布;位置參數(shù)a決定了分布的中心位置;分散系數(shù)γ用于度量分布偏離其均值的程度;偏斜參數(shù)β決定了分布的對(duì)稱程度,當(dāng)其值為0 時(shí),分布關(guān)于a對(duì)稱,稱為對(duì)稱Alpha 穩(wěn)定分布(SymmetricαStable,SαS),當(dāng)a=0且γ=1時(shí),稱為標(biāo)準(zhǔn)Alpha穩(wěn)定分布.
由于Alpha 穩(wěn)定分布不存在有限的二階矩,通常采用混合信噪比MSNR=(dB)來衡量信號(hào)與噪聲的功率關(guān)系,其中為有用信號(hào)方差.
海洋環(huán)境噪聲對(duì)水聲通信信號(hào)的幅度和相位產(chǎn)生干擾,環(huán)境噪聲越強(qiáng),干擾越明顯.只有盡可能降低接收信號(hào)中的噪聲成分,才能最大限度還原發(fā)送的原始有用信號(hào).傳統(tǒng)的基于信號(hào)處理的降噪方法的核心思想是“濾波”,即對(duì)接收信號(hào)進(jìn)行不同方式的分解,找到表征噪聲的分量,然后將其濾除,這種方法往往需要借助人工領(lǐng)域知識(shí),才能較好地判別出噪聲成分,特別是復(fù)雜噪聲環(huán)境中對(duì)人工領(lǐng)域知識(shí)的依賴更強(qiáng).
利用深度學(xué)習(xí)方法進(jìn)行降噪處理能夠降低對(duì)人工領(lǐng)域知識(shí)的依賴,是目前圖像、語音信號(hào)處理的研究熱點(diǎn)[8,9],但是在水聲信號(hào)處理中的應(yīng)用還比較少,特別是針對(duì)水聲通信信號(hào)的降噪處理還沒有比較成熟的研究成果.與圖像和語音信號(hào)相比,水聲通信信號(hào)的環(huán)境噪聲更復(fù)雜,水聲信道多途特性對(duì)接收信號(hào)影響大,而且在很多應(yīng)用場景下接收信號(hào)是微弱的,這些特點(diǎn)增加了利用深度學(xué)習(xí)方法進(jìn)行信號(hào)降噪的難度.
本文借鑒文獻(xiàn)[8]提出的語音增強(qiáng)相對(duì)生成對(duì)抗網(wǎng)絡(luò)(Speech Enhancement Relativistic Generative Adversarial Networks,SERGAN),提出一種復(fù)雜海洋環(huán)境下基于RCGAN 的水聲通信信號(hào)降噪方法,降噪模型如圖1所示.
圖1 基于RCGAN的水聲通信信號(hào)降噪模型
圖1 模型包括訓(xùn)練過程和測(cè)試過程.訓(xùn)練過程模型由生成器(Generator,G)和判決器(Discriminator,D)組成.首先,將含噪信號(hào)訓(xùn)練集輸入生成器中,得到生成器生成信號(hào).再將它和不含噪的目標(biāo)信號(hào)分別與含噪信號(hào)拼接后,依次輸入判決器中.然后,判決器將含噪信號(hào)作為條件信息,對(duì)輸入信號(hào)進(jìn)行真假鑒別,判斷輸入為目標(biāo)信號(hào)或是由生成器所生成.最后,通過計(jì)算判決結(jié)果與真實(shí)標(biāo)簽的誤差,利用反向傳播算法完成網(wǎng)絡(luò)參數(shù)的更新和優(yōu)化.測(cè)試過程模型是在訓(xùn)練模型基礎(chǔ)上由訓(xùn)練后的生成器模型完成對(duì)待測(cè)信號(hào)的降噪處理.
對(duì)于標(biāo)準(zhǔn)的生成對(duì)抗網(wǎng)絡(luò)(Standard Generative Adversarial Networks,SGAN)[10],訓(xùn)練過程的生成器通過不斷學(xué)習(xí)目標(biāo)數(shù)據(jù)的概率分布,將輸入數(shù)據(jù)分布逐步映射成目標(biāo)數(shù)據(jù)分布,判決器則通過更新自身網(wǎng)絡(luò)參數(shù),不斷優(yōu)化完善其學(xué)習(xí)得到的判決準(zhǔn)則,進(jìn)而提升真假鑒別能力.整個(gè)訓(xùn)練過程中網(wǎng)絡(luò)能夠通過生成器和判決器的相互作用,學(xué)習(xí)到目標(biāo)數(shù)據(jù)的內(nèi)在規(guī)律,構(gòu)建出目標(biāo)數(shù)據(jù)分布,并將生成器的輸入數(shù)據(jù)擬合成具有目標(biāo)數(shù)據(jù)特性的數(shù)據(jù).
條件生成對(duì)抗網(wǎng)絡(luò)(Conditional Generative Adversarial Networks,CGAN)[11]在SGAN 的基礎(chǔ)上通過引入目標(biāo)數(shù)據(jù)的條件信息作為判決器的輸入,使得判決器能夠依據(jù)條件信息對(duì)生成數(shù)據(jù)更好地鑒別,生成器也能夠有針對(duì)性地生成數(shù)據(jù),從而提升生成數(shù)據(jù)與目標(biāo)數(shù)據(jù)的匹配度.因此,本文將理想的無噪信號(hào)作為先驗(yàn)?zāi)繕?biāo)信號(hào)數(shù)據(jù),將這些先驗(yàn)?zāi)繕?biāo)信號(hào)數(shù)據(jù)疊加噪聲后的含噪信號(hào)作為輸入條件信息數(shù)據(jù).通過圖1 模型不斷迭代訓(xùn)練,當(dāng)模型訓(xùn)練完成后,該網(wǎng)絡(luò)具備了將輸入含噪信號(hào)映射成對(duì)應(yīng)的無噪信號(hào)的能力,這就是本文采用RCGAN網(wǎng)絡(luò)降噪的基本原理.
基于RCGAN 的信號(hào)降噪網(wǎng)絡(luò)包含生成器網(wǎng)絡(luò)和判決器網(wǎng)絡(luò).其中,生成器網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示.
圖2 生成器網(wǎng)絡(luò)結(jié)構(gòu)
圖2中的生成器采用了類似自動(dòng)編碼器的結(jié)構(gòu),包含7 個(gè)一維卷積層(Conv1~Conv7)、3 個(gè)一維擴(kuò)張卷積層(D-Conv1~D-Conv3)和7個(gè)一維反卷積層(T-Conv1~TConv7),并采用殘差連接將卷積層組成的編碼器與反卷積層組成的解碼器相連.其中,編碼部分對(duì)數(shù)據(jù)不斷壓縮降維,逐步拋棄原始高維信號(hào)中無用或者冗余的信息,而信號(hào)本質(zhì)有用信息將被保留并映射至低維變量,再通過擴(kuò)張卷積層[12]完成更大視野上的特征提取,最后通過解碼過程重構(gòu)原始高維有用信號(hào).各卷積層中,“s”“c”和“k”分別表示卷積步長、卷積核數(shù)量以及卷積核長度.除T-conv7 層外,各層輸出之后均采用激活因子為0.1 的Leaky ReLU 函數(shù)對(duì)輸出進(jìn)行非線性激活.
綜合考慮水聲通信信號(hào)帶寬和采樣率,本文將網(wǎng)絡(luò)的輸入維度設(shè)計(jì)為8192.同時(shí),由于步長卷積和微步長卷積在GAN 中具有比確定性空間池化函數(shù)更好的性能[13],因此,網(wǎng)絡(luò)中不再設(shè)置池化結(jié)構(gòu),而是由步長卷積層和微步長反卷積層替代.此外,卷積層的輸出通過殘差連接[14]映射至對(duì)應(yīng)的反卷積層并進(jìn)行向量拼接,此類恒等映射能將信息直接從卷積層傳遞至反卷積層,有利于保護(hù)細(xì)節(jié)特征在維度壓縮的過程中不被丟失,而且損失函數(shù)的梯度能傳遞至更多的層,很大程度上改善了深層網(wǎng)絡(luò)梯度消失的問題.
為了提高網(wǎng)絡(luò)在降噪過程中對(duì)信號(hào)細(xì)節(jié)信息的保留能力,生成器中間層采用了圖像語義分割中廣泛采用的擴(kuò)張卷積結(jié)構(gòu)[15].擴(kuò)張卷積通過在卷積核中插零來擴(kuò)展卷積核的感受視野,相比標(biāo)準(zhǔn)卷積結(jié)構(gòu)中采用的下采樣等感受視野擴(kuò)充方法,它對(duì)細(xì)節(jié)信息的保留能力更強(qiáng).通常采用擴(kuò)張率來表示卷積核中相鄰點(diǎn)之間的間隔點(diǎn)數(shù),標(biāo)準(zhǔn)卷積核的擴(kuò)張率為1.如圖2 所示,該生成器中三個(gè)一維擴(kuò)張卷積層采用的擴(kuò)張率r分別取1、2 和4,卷積核長度均為3,依據(jù)文獻(xiàn)[12],可計(jì)算得到這3 個(gè)一維擴(kuò)張卷積層的卷積核感受視野大小分別為3、7 和15,呈指數(shù)級(jí)增長.而相同條件下,采用標(biāo)準(zhǔn)卷積獲得的感受視野大小分別為3、5 和7,呈線性增長.研究表明,擴(kuò)張卷積正是憑借這種信息無損的感受視野擴(kuò)展,在語義分割中對(duì)小尺度信息特征處理上得到了更好的保留效果[12].因此,本文將該結(jié)構(gòu)用在生成器的中間層來提升網(wǎng)絡(luò)對(duì)信號(hào)細(xì)節(jié)信息的提取能力.
如圖3所示,判決器采用了三個(gè)與生成器中編碼部分類似的步長卷積層(Conv8~Conv10)以及同樣的非線性激活函數(shù)來實(shí)現(xiàn)特征的提取,然后添加了一個(gè)單卷積核的一維卷積層(Conv11)完成特征通道的壓縮,并將得到的一維特征向量與一個(gè)全連接層(Fc1)相連,最后采用單節(jié)點(diǎn)輸出判決結(jié)果.
圖3 判決器網(wǎng)絡(luò)結(jié)構(gòu)
圖1 模型中對(duì)抗訓(xùn)練過程的核心是構(gòu)造有效的生成對(duì)抗損失函數(shù)來度量生成數(shù)據(jù)與目標(biāo)數(shù)據(jù)的分布差異.SGAN 中采用的二元交叉熵?fù)p失函數(shù)[10]本質(zhì)上度量的是兩個(gè)分布的Jensen-Shannon 散度,而所用數(shù)據(jù)通常是從高維空間的低維流型中采樣得到,其分布交叉項(xiàng)很小,導(dǎo)致Jensen-Shannon 散度很可能一直保持一個(gè)較大值,造成梯度消失而難以優(yōu)化,存在訓(xùn)練不收斂[13]、模式崩潰等問題,后續(xù)改進(jìn)包括最小二乘損失函數(shù)[16]、Wasserstein 距離[17]和梯度懲罰項(xiàng)[18]等.文獻(xiàn)[19]中提出了一種相對(duì)判決損失函數(shù),通過估計(jì)真實(shí)數(shù)據(jù)與隨機(jī)選取假數(shù)據(jù)分別被判為真的概率之差,在促進(jìn)假的生成數(shù)據(jù)被判為真的同時(shí),也降低了真實(shí)數(shù)據(jù)被判為真的概率,更符合一個(gè)批次訓(xùn)練數(shù)據(jù)中真假數(shù)據(jù)各占一半的前提,在圖像生成[19]和語音增強(qiáng)[8]方面都取得了比上述其他損失函數(shù)更好的性能.
因此,本文也采用能夠更好度量兩個(gè)分布差異特性的相對(duì)判決損失函數(shù),在生成器和判決器中分別表示為LRS(G)和LRS(D).此外,參考文獻(xiàn)[8],生成器中加入了一階的L1范數(shù)懲罰項(xiàng)(G)來約束目標(biāo)無噪數(shù)據(jù)和生成數(shù)據(jù)之間的誤差,在脈沖噪聲條件下依然能有效提高網(wǎng)絡(luò)的訓(xùn)練效率.判決器中則引入梯度懲罰項(xiàng)LGP(D)來穩(wěn)定訓(xùn)練過程以及防止梯度消失和爆炸現(xiàn)象.因此,生成器和判決器總損失函數(shù)LG和LD可分別表示為
其中,當(dāng)采用xs和xy分別表示原始有用信號(hào)和含噪信號(hào)時(shí),生成器生成信號(hào)xG=G(xy),則xr為xs與xy構(gòu)成的數(shù)據(jù)對(duì),xf為xG與xy構(gòu)成的數(shù)據(jù)對(duì);C表示判決器網(wǎng)絡(luò)構(gòu)成的非線性函數(shù);σ為Sigmoid 激活函數(shù);P和Q分別表示xr和xf的概率分布;是含噪信號(hào)xy與+(1-μ)xG的聯(lián)合分布(其中μ為0到1之間的隨機(jī)實(shí)數(shù)).
在實(shí)際的訓(xùn)練過程中,生成器和判決器的學(xué)習(xí)率均設(shè)為0.0001,批大?。╞atch size)設(shè)為128,權(quán)值和λGP分別取200 和10,以實(shí)現(xiàn)與生成損失項(xiàng)LRS(G)和判決損失項(xiàng)LRS(D)的平衡,并采用Adam 優(yōu)化器對(duì)損失函數(shù)進(jìn)行優(yōu)化,所有數(shù)據(jù)迭代次數(shù)為200次.
圖1的降噪模型中,通常希望訓(xùn)練數(shù)據(jù)集與測(cè)試數(shù)據(jù)集具有相同的分布,但是在水聲通信信號(hào)降噪應(yīng)用中,很難得到足夠數(shù)量的與測(cè)試數(shù)據(jù)具有相同分布的訓(xùn)練數(shù)據(jù).本文利用遷移學(xué)習(xí)思想,通過構(gòu)造包含與測(cè)試數(shù)據(jù)中發(fā)送信號(hào)具有相同分布的數(shù)據(jù)模型,產(chǎn)生遷移數(shù)據(jù)訓(xùn)練集,然后結(jié)合少量與測(cè)試數(shù)據(jù)具有相同分布的目標(biāo)信號(hào)數(shù)據(jù)訓(xùn)練集,通過兩步訓(xùn)練方法完成RCGAN網(wǎng)絡(luò)的優(yōu)化.
遷移數(shù)據(jù)模型為
與式(1)相比,式(6)簡化了水聲多途信道的影響,雖然兩個(gè)模型所產(chǎn)生數(shù)據(jù)的分布發(fā)生了變化,但是二者包含了相同的發(fā)送信號(hào)集合,即y(t)和的波形中包含相同成分,因此具備可遷移性.
將傳統(tǒng)的兩步遷移策略[20]引入RCGAN 中,給出了適用于生成對(duì)抗網(wǎng)絡(luò)的兩步遷移學(xué)習(xí)策略,具體流程如圖4所示.
圖4 RCGAN模型遷移兩步訓(xùn)練方法示意圖
圖4 中,首先利用遷移數(shù)據(jù)訓(xùn)練集對(duì)RCGAN 網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,待網(wǎng)絡(luò)性能達(dá)到最優(yōu)后,結(jié)合生成對(duì)抗網(wǎng)絡(luò)交叉迭代的訓(xùn)練機(jī)制,利用少量目標(biāo)信號(hào)訓(xùn)練數(shù)據(jù)對(duì)判決器和生成器進(jìn)行交叉迭代微調(diào),即微調(diào)其中一者時(shí),需要凍結(jié)另一者的所有參數(shù),以提升對(duì)目標(biāo)信號(hào)的降噪性能.然而,在利用少量數(shù)據(jù)對(duì)預(yù)訓(xùn)練的判決器或生成器網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào)時(shí),很容易因數(shù)據(jù)量不足而造成過擬合現(xiàn)象,常用的做法是凍結(jié)網(wǎng)絡(luò)大部分層的參數(shù),而只對(duì)其中少數(shù)幾層參數(shù)進(jìn)行更新.根據(jù)文獻(xiàn)[20]的發(fā)現(xiàn),網(wǎng)絡(luò)的低層通常提取一般的通用性特征,而高層往往能提取更加具體的特征,對(duì)輸入數(shù)據(jù)集的針對(duì)性更強(qiáng).因此,在微調(diào)過程中依次微調(diào)判決器或生成器網(wǎng)絡(luò)最后幾層參數(shù),同時(shí)凍結(jié)其余所有參數(shù).
實(shí)驗(yàn)中,信號(hào)采樣頻率為48 kHz,載頻范圍為[15,16]kHz.2FSK、4FSK、8FSK、OFDM、MPSK 和DSSS 信號(hào)的碼元速率范圍分別為[530,1000]Bd、[320,600]Bd、[170,330]Bd、[100,200]Bd、[1.6k,3000]Bd 和[1600,3000]Bd.MFSK的調(diào)制指數(shù)為1,MPSK的根升余弦滾降系數(shù)為0.25,OFDM 的循環(huán)前綴為0.25、子載波數(shù)為16,LFM 的調(diào)頻斜率范圍為[150,250]Hz/ms,DSSS 的PN序列采用周期為63的m序列.
圖4 預(yù)訓(xùn)練過程中采用的遷移數(shù)據(jù)訓(xùn)練集依據(jù)式(6)中的遷移數(shù)據(jù)模型產(chǎn)生,其中指數(shù)在[1.5,2]范圍內(nèi)隨機(jī)選取,混合信噪比范圍為[-5,15]dB.此外,水聲通信信號(hào)通常是突發(fā)的,因此,為提高本文方法在實(shí)際接收數(shù)據(jù)中缺乏先驗(yàn)知識(shí)場景下的實(shí)用性,本文設(shè)計(jì)了如圖5所示的信號(hào)數(shù)據(jù)結(jié)構(gòu).
圖5 信號(hào)數(shù)據(jù)結(jié)構(gòu)
處理數(shù)據(jù)塊中包含噪聲數(shù)據(jù)塊和疊加了噪聲的通信數(shù)據(jù)塊,通信數(shù)據(jù)塊的長度以及位置是隨機(jī)的,且通信數(shù)據(jù)塊長度L滿足0 ≤L≤Lp,Lp為處理數(shù)據(jù)塊長度,即網(wǎng)絡(luò)的輸入維度大小8192.采用上述信號(hào)數(shù)據(jù)結(jié)構(gòu),每種信號(hào)產(chǎn)生4000 個(gè)樣本,共36000 個(gè)樣本組成遷移數(shù)據(jù)訓(xùn)練集來完成網(wǎng)絡(luò)的預(yù)訓(xùn)練.
3.3.1 本文算法有效性驗(yàn)證
為驗(yàn)證本文方法在水聲多途信道和Alpha 穩(wěn)定分布噪聲條件下的有效性,依據(jù)式(1),利用文獻(xiàn)[21]中的經(jīng)典水聲稀疏信道,信道傳遞函數(shù)為
α指數(shù)選取文獻(xiàn)[22]中所給典型值1.8,調(diào)制類型為BPSK,接收信號(hào)混合信噪比為-2 dB,產(chǎn)生測(cè)試數(shù)據(jù)時(shí)長682.6 ms,其中通信數(shù)據(jù)段的起止時(shí)刻分別為130 ms和471.3 ms,其余時(shí)間段為噪聲.分別采用消隱法和在遷移數(shù)據(jù)訓(xùn)練集下預(yù)訓(xùn)練好的RCGAN 網(wǎng)絡(luò)對(duì)其進(jìn)行降噪,并從時(shí)域波形和功率譜圖上對(duì)降噪效果進(jìn)行對(duì)比,如圖6所示,消隱法的具體參數(shù)依據(jù)文獻(xiàn)[5]中所給參數(shù)選取.
圖6 BPSK信號(hào)降噪前后時(shí)域波形和功率譜圖對(duì)比
如圖6 所示,受信道影響,接收信號(hào)時(shí)域波形和功率譜發(fā)生嚴(yán)重畸變.采用消隱法和本文方法均具有降噪效果.對(duì)比兩種方法,使用消隱法降噪后,時(shí)域波形上的高幅值脈沖成分被很好地消除,但殘留的低幅值噪聲依然存在,從功率譜圖中能觀察到信噪比的顯著提升,但信號(hào)帶內(nèi)衰落依然很明顯.而使用本文方法進(jìn)行降噪處理后,不僅接收信號(hào)中的高幅值脈沖噪聲成分被很好地消除,低幅值的噪聲也被很好地抑制,從功率譜圖中能夠看出本文方法的有用信號(hào)恢復(fù)能力優(yōu)于消隱法.
為了驗(yàn)證本文算法對(duì)不同信號(hào)本質(zhì)特征的保留能力,進(jìn)行如下實(shí)驗(yàn).發(fā)送信號(hào)采用8FSK 調(diào)制,信道傳遞函數(shù)采用沖激函數(shù),噪聲的α指數(shù)為1.8,混合信噪比為-2 dB,生成時(shí)長170.7 ms 的突發(fā)測(cè)試信號(hào),圖7 中對(duì)比了該信號(hào)降噪前后的時(shí)頻圖.
圖7 8FSK信號(hào)降噪前后時(shí)頻圖對(duì)比
如圖7 所示,接收信號(hào)受噪聲影響,其攜帶的原始時(shí)頻信息幾乎被噪聲所掩蓋,難以清晰觀察.SERGAN網(wǎng)絡(luò)對(duì)該噪聲具有較好的降噪能力,背景噪聲被大大消除,而且降噪后碼元信息與原始信號(hào)保持了良好的對(duì)應(yīng)關(guān)系,但各碼元內(nèi)存在一定的時(shí)頻模糊.而采用本文方法,不僅能夠大幅提高信噪比,而且碼元更為清晰.這種性能的提升是由本文方法引入的擴(kuò)張卷積帶來的,感受視野的擴(kuò)張?jiān)鰪?qiáng)了網(wǎng)絡(luò)對(duì)信號(hào)細(xì)節(jié)信息的捕捉能力,該實(shí)驗(yàn)結(jié)果有效驗(yàn)證了本文方法對(duì)信號(hào)本質(zhì)特征的保留.
3.3.2 不同算法性能比較
為了對(duì)比本文方法與其他方法的性能差異,分別在高斯噪聲和Alpha 穩(wěn)定分布噪聲條件下比較了不同方法的降噪性能,采用的量化衡量指標(biāo)為輸出信噪比.圖8 中對(duì)比了高斯噪聲條件下本文方法與基于小波分解的降噪方法、基于帶通濾波的降噪方法以及SERGAN 網(wǎng)絡(luò)降噪方法在不同輸入信噪比下的降噪性能差異.實(shí)驗(yàn)中,信道傳遞函數(shù)采用沖激函數(shù),測(cè)試信號(hào)的輸入信噪比在[-15,15]dB 范圍內(nèi)以3 dB 為步長選取,每種信噪比下每種信號(hào)生成200個(gè)樣本組成測(cè)試集,且通信數(shù)據(jù)塊長度L=Lp.
如圖8所示,本文方法與SERGAN 網(wǎng)絡(luò)方法整體降噪性能差異不大,但在-5 dB 以上時(shí)性能相對(duì)有所提升,且降噪性能明顯優(yōu)于兩類傳統(tǒng)方法,在0 dB 信噪比條件下相比基于小波分解的降噪方法和帶通濾波的降噪方法輸出信噪比分別提升了大約10 dB和7 dB.
圖8 高斯噪聲下不同方法降噪性能對(duì)比
此外,圖9 對(duì)比了Alpha 穩(wěn)定分布噪聲條件下本文方法與文獻(xiàn)[5]中的消隱法、截?cái)喾?、無記憶模擬非線性預(yù)處理器(Memoryless Analog Nonlinear Preprocessor,MANP)以及SERGAN 網(wǎng)絡(luò)降噪方法在不同混合信噪比下的降噪性能差異,實(shí)驗(yàn)中信道傳遞函數(shù)采用沖激函數(shù),α指數(shù)固定為1.8,混合信噪比在[-5,15]dB 范圍內(nèi)以2 dB為步長選取,測(cè)試數(shù)據(jù)量同上一個(gè)實(shí)驗(yàn).
從圖9 中可以看出,本文方法在Alpha 穩(wěn)定分布噪聲條件下降噪效果明顯優(yōu)于三種傳統(tǒng)的脈沖噪聲消除方法,相比SERGAN 網(wǎng)絡(luò)方法也有明顯提升.結(jié)合圖6可知,本文方法優(yōu)勢(shì)在于不僅能對(duì)Alpha 穩(wěn)定分布噪聲中的高幅值脈沖成分進(jìn)行有效濾除,對(duì)低幅值噪聲也有更好的抑制效果,同時(shí)能更好地保留信號(hào)的細(xì)節(jié)信息.
圖9 Alpha穩(wěn)定分布噪聲下不同方法降噪性能對(duì)比
3.3.3 模型遷移性能分析
為了驗(yàn)證在有少量目標(biāo)信號(hào)訓(xùn)練數(shù)據(jù)可用的情況下,采用模型遷移的方法對(duì)預(yù)訓(xùn)練RCGAN 網(wǎng)絡(luò)進(jìn)行微調(diào)能夠進(jìn)一步提升網(wǎng)絡(luò)對(duì)目標(biāo)信號(hào)的降噪性能,本文依據(jù)式(1)中的信號(hào)模型,其中的信道沖激響應(yīng)采用式(7),Alpha 穩(wěn)定分布噪聲的α指數(shù)為1.8,構(gòu)建了不同數(shù)據(jù)量的目標(biāo)信號(hào)數(shù)據(jù)訓(xùn)練集,對(duì)預(yù)訓(xùn)練網(wǎng)絡(luò)的不同層參數(shù)進(jìn)行微調(diào),分析其性能.
為了評(píng)估微調(diào)不同網(wǎng)絡(luò)層參數(shù)對(duì)降噪性能的影響,采用每種信號(hào)100 個(gè)樣本構(gòu)建目標(biāo)信號(hào)數(shù)據(jù)訓(xùn)練集,分別對(duì)RCGAN 中生成器和判決器網(wǎng)絡(luò)最后1、2、3、4 或5 層參數(shù)進(jìn)行微調(diào),得到微調(diào)之后網(wǎng)絡(luò)降噪性能如圖10所示.
圖10 微調(diào)不同網(wǎng)絡(luò)層參數(shù)降噪性能對(duì)比
如圖10 所示,降噪性能與微調(diào)的網(wǎng)絡(luò)層數(shù)緊密相關(guān):當(dāng)微調(diào)網(wǎng)絡(luò)最后3層參數(shù)時(shí),輸出信噪比達(dá)到最高;當(dāng)微調(diào)層數(shù)過少時(shí),降噪性能的提升有限,甚至不如微調(diào)之前;當(dāng)微調(diào)層數(shù)過多時(shí),由于參數(shù)量太大而造成過擬合,也會(huì)導(dǎo)致降噪性能的下降.
在此結(jié)果基礎(chǔ)上,繼續(xù)評(píng)估不同微調(diào)數(shù)據(jù)量對(duì)降噪性能的影響.實(shí)驗(yàn)中,分別采用每種信號(hào)20、50、100和200個(gè)樣本構(gòu)建目標(biāo)信號(hào)數(shù)據(jù)訓(xùn)練集,對(duì)預(yù)訓(xùn)練生成器和判決器網(wǎng)絡(luò)的最后3層參數(shù)同時(shí)進(jìn)行微調(diào),得到如圖11所示的降噪性能對(duì)比.
如圖11 所示,微調(diào)之后的網(wǎng)絡(luò)降噪性能隨著微調(diào)數(shù)據(jù)量的增加而提升,表明網(wǎng)絡(luò)在微調(diào)的過程中初步學(xué)習(xí)到了信道的相關(guān)信息,驗(yàn)證了在小樣本條件下采用基于模型遷移的兩步訓(xùn)練策略對(duì)提高目標(biāo)信號(hào)降噪性能的有效性.
圖11 不同微調(diào)數(shù)據(jù)量降噪性能對(duì)比
為驗(yàn)證算法在實(shí)際信號(hào)環(huán)境下的可行性,分別在校園人工湖和廈門五緣灣海域進(jìn)行了實(shí)際信號(hào)的收發(fā)實(shí)驗(yàn),并使用在遷移數(shù)據(jù)訓(xùn)練集下預(yù)訓(xùn)練好的RCGAN網(wǎng)絡(luò)對(duì)接收信號(hào)進(jìn)行降噪處理,實(shí)驗(yàn)參數(shù)如表1所示.
表1 實(shí)驗(yàn)參數(shù)
實(shí)驗(yàn)中,發(fā)射節(jié)點(diǎn)采用一個(gè)中心頻率為16 kHz 的全向換能器,工作帶寬為13~18 kHz,接收節(jié)點(diǎn)采用Ocean Sonics 公司的RB9-ETH 智能水聽器,工作帶寬為10 Hz~200 kHz.
在校園人工湖實(shí)驗(yàn)中,發(fā)送信號(hào)采用BPSK 調(diào)制,產(chǎn)生測(cè)試數(shù)據(jù)時(shí)長為170 ms,接收信號(hào)時(shí)長為256 ms,采用樣本分位法[23]估計(jì)得到接收信號(hào)的α指數(shù)為2,即接收信號(hào)中疊加的噪聲可近似認(rèn)為服從高斯分布.
如圖12 所示,信號(hào)受信道影響,信噪比下降嚴(yán)重,且時(shí)域波形和功率譜圖上都出現(xiàn)明顯畸變.經(jīng)本文方法降噪后,時(shí)域波形中噪聲成分被很好地濾除,功率譜圖中也能觀察到信噪比的顯著提升,驗(yàn)證了算法在實(shí)際高斯噪聲環(huán)境下的有效性.
圖12 BPSK信號(hào)降噪前后時(shí)域波形和功率譜圖對(duì)比
在廈門五緣灣海域?qū)嶒?yàn)中,設(shè)備布放情況如圖13所示,S1和S2分別表示發(fā)送和接收節(jié)點(diǎn),信號(hào)調(diào)制方式和時(shí)長同上.
圖13 廈門五緣灣海域?qū)嶒?yàn)設(shè)備布放情況
通過樣本分位法,得到接收信號(hào)的α指數(shù)估計(jì)值為1.53,相應(yīng)地從圖14(a)中的時(shí)域波形上可以觀察到強(qiáng)烈的脈沖成分,同時(shí)也存在較強(qiáng)的非脈沖成分噪聲.圖14(b)的功率譜圖中也存在明顯的畸變和衰落.經(jīng)本文方法降噪處理后,接收信號(hào)中的背景噪聲得到了有效的抑制,信噪比提升明顯,幾乎達(dá)到了發(fā)送信號(hào)的水平,驗(yàn)證了算法在實(shí)際Alpha 穩(wěn)定分布噪聲條件下的有效性.
圖14 BPSK信號(hào)降噪前后時(shí)域波形和功率譜圖對(duì)比
針對(duì)實(shí)際海洋環(huán)境噪聲條件下水聲通信信號(hào)接收質(zhì)量下降及第三方檢測(cè)與識(shí)別困難的問題,本文提出了一種基于相對(duì)條件生成對(duì)抗網(wǎng)絡(luò)和遷移學(xué)習(xí)的噪聲消除方法.仿真實(shí)驗(yàn)和兩個(gè)水域的實(shí)測(cè)信號(hào)分析表明,該方法在高斯分布和Alpha 穩(wěn)定分布噪聲條件下相比傳統(tǒng)方法都有更好的降噪性能,對(duì)水聲信道也具有一定的穩(wěn)健性,對(duì)目標(biāo)信號(hào)訓(xùn)練樣本數(shù)量要求低,在實(shí)際復(fù)雜噪聲環(huán)境下具有較高可行性.同時(shí),本文算法核心思想可以繼續(xù)拓展到其他領(lǐng)域的通信信號(hào)和非通信信號(hào)降噪應(yīng)用中.