趙孟晨,姚秀娟,王 靜,董蘇惠
(1.中國科學(xué)院國家空間科學(xué)中心,北京 100190;2.中國科學(xué)院大學(xué)電子電氣與通信工程學(xué)院,北京 100049)
近年來,國內(nèi)外的衛(wèi)星星座組網(wǎng)計(jì)劃發(fā)展迅速,星地通信、星間通信使得頻譜擁擠進(jìn)一步加劇,同頻信號(hào)混疊干擾難以避免[1],空間通信電磁環(huán)境呈現(xiàn)時(shí)頻混疊、空間交錯(cuò),在現(xiàn)實(shí)空間通信環(huán)境中,魯棒的信號(hào)處理通常需要自動(dòng)信號(hào)分離[2-3]。在密集的星座互聯(lián)網(wǎng)通信場景下,達(dá)到接收端的源信號(hào)可能是多個(gè)通道的混疊信號(hào),而地面站觀測通道數(shù)目有限,因此欠定盲源分離的應(yīng)用場景極為常見。常規(guī)的二步法、稀疏特征表示法等欠定分離方法[4-6]在單通道條件下分離效果欠佳,單通道通信信號(hào)盲源分離問題亟待解決。
研究者提出了許多解決分離問題的方法。獨(dú)立成分分析堆疊時(shí)域卷積網(wǎng)絡(luò)(stacked time-domain convolutional network,Stacked-TCN)[7]在超定分離方面表現(xiàn)良好,但在欠定盲源分離場景下效果欠佳?;诰垲惙ǖ南∈璺至糠治?sparse component analysis,SCA)[8]需要已知混合信號(hào)的數(shù)目。時(shí)-頻掩模方法[9-12]提高了分離精確度,但存在幅度和相位解耦,短時(shí)傅里葉變換需要較高分辨率的頻率分解窗,限制在低延遲系統(tǒng)中的適用性。非負(fù)矩陣分解(non-negative matrix factorization,NMF)[13-14]可以在時(shí)域進(jìn)行分解,但在泛化為大數(shù)據(jù)的能力方面較弱?;贙alman濾波[15]、LCL-FRESH濾波[16]、循環(huán)維納濾波的單通道分離[17]計(jì)算復(fù)雜度高,實(shí)用效果有待提高。
隨著大數(shù)據(jù)的發(fā)展和算力的提高,深度學(xué)習(xí)在時(shí)序信號(hào)處理如語音識(shí)別、語音分離[18-38]、通信信號(hào)調(diào)制識(shí)別[39]上取得了巨大成功,展示出了深度學(xué)習(xí)強(qiáng)大的特征提取和時(shí)序信號(hào)處理能力。然而,深度學(xué)習(xí)在通信信號(hào)處理上的應(yīng)用多見于常規(guī)的調(diào)制識(shí)別與分類任務(wù),在單通道通信信號(hào)分離等復(fù)雜任務(wù)上尚未涉足。
本文提出的通信信號(hào)單通道盲源分離方法,引入了數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)方法,采用基于Stacked-TCN的全卷積時(shí)域分離網(wǎng)絡(luò)(convolution time-domain audio separation network,Conv-TasNet)分離框架。首先,使用1-D卷積對(duì)混合通信信號(hào)提取編碼特征表示,將其作為輸入。然后,使用時(shí)域卷積網(wǎng)絡(luò),訓(xùn)練得到純凈信號(hào)源的深層特征掩模,將每個(gè)信號(hào)源的掩模與得到的混合信號(hào)編碼特征做Hadamard乘積,可以得到源信號(hào)的編碼特征表示。最后,再次使用1-D卷積,對(duì)得到的源信號(hào)特征進(jìn)行解碼,得到原始波形。訓(xùn)練的損失函數(shù)采用比例不變信噪比,以此度量掩模估計(jì)準(zhǔn)確度和信號(hào)分離準(zhǔn)確度。實(shí)驗(yàn)結(jié)果表明,該方法有效提高了單通道通信信號(hào)盲源分離精度,具有較好的噪聲魯棒性。
x(t)=As(t)+n(t)
(1)
式中:A為混合矩陣;m為源信號(hào)的個(gè)數(shù);n為接收天線陣元個(gè)數(shù)。當(dāng)n 單通道欠定盲源分離瞬時(shí)混合模型為 (2) 為了對(duì)通信信號(hào)的深層特征進(jìn)行有效提取,以提高分離精度,本文采用以Stacked-TCN為基礎(chǔ)的Conv-TasNet框架進(jìn)行訓(xùn)練。序列信號(hào)的準(zhǔn)確分離需要較長的時(shí)間窗口信息,即長時(shí)依賴性,而時(shí)域卷積網(wǎng)(time-domain convolutional network,TCN)在序列信號(hào)建模和處理上的優(yōu)越性能,可以滿足語音信號(hào)、通信信號(hào)等序列信號(hào)的長時(shí)依賴性建模。每個(gè)TCN為一個(gè)1-D單元塊,如圖1所示。Gonv-TasNet結(jié)構(gòu)如圖2所示。 圖1 1-D單元塊結(jié)構(gòu)圖Fig.1 Structure of 1-D unit block 圖2 分離模塊網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Network structure of separation block 對(duì)一維混合通信源信號(hào)使用1-D卷積進(jìn)行線性編碼特征表示。其中,使用512組卷積核,生成混合信號(hào)的多維編碼特征,將多維編碼特征表示作為分離網(wǎng)絡(luò)的輸入: xencoder=hencoder(x)=w1*x+b1 (3) 式中:hencoder(·)為卷積操作;w1和b1分別為卷積核的權(quán)重和偏置。 步驟 1首先,進(jìn)行層歸一化。層歸一化[40]是對(duì)一個(gè)中間層的所有神經(jīng)元進(jìn)行歸一化,使其輸入分布在訓(xùn)練過程保持一致,解決每次的梯度下降更新參數(shù)導(dǎo)致的內(nèi)部協(xié)變量偏移問題,從而增強(qiáng)模型的泛化能力,同時(shí)避免了梯度消失和梯度爆炸。再使用1×1卷積作為瓶頸層,以減少特征通道的數(shù)目。 步驟 2隨后,特征進(jìn)入堆疊的TCN,每個(gè)堆疊塊包含4個(gè)TCN,其卷積核為空洞卷積核[18]膨脹率依次增加,分別為1、2、4、8。不同膨脹率的卷積核,可以有效提取并融合多尺度的時(shí)序通信信號(hào)特征,充分對(duì)信號(hào)分離的長時(shí)依賴性進(jìn)行建模。其中,每個(gè)1-D單元塊采用深度可分離卷積。深度可分離卷積[41]是普通卷積在通道上的分解,將一個(gè)卷積核分裂為獨(dú)立的深度卷積(depthwise,DW)和點(diǎn)向卷積(pointwise,PW),可以有效減少參數(shù)數(shù)量,運(yùn)算成本和模型大小,用于構(gòu)建輕量級(jí)網(wǎng)絡(luò)[19]。1-D單元塊的殘差網(wǎng)絡(luò)連接方式,可以防止隨著網(wǎng)絡(luò)層數(shù)加深導(dǎo)致的訓(xùn)練退化問題。此堆疊塊進(jìn)行3次重復(fù)連接,將每一次堆疊輸出作為下一次的輸入,進(jìn)一步加深網(wǎng)絡(luò)層數(shù),提取源信號(hào)的深層本質(zhì)特征。對(duì)通信信號(hào)進(jìn)行不同窗口不同尺度和深度的特征提取,有效融合多層特征。 步驟 3通過帶泄露的修正線性單元(Leaky ReLU)作為激活函數(shù),由于其導(dǎo)數(shù)不存在零點(diǎn),可以防止負(fù)區(qū)間中神經(jīng)元不學(xué)習(xí)問題。然后,再次使用1×1卷積瓶頸層,恢復(fù)特征通道數(shù)量,經(jīng)過sigmoid激活函數(shù),訓(xùn)練獲得兩個(gè)源信號(hào)的時(shí)域掩模: (4) 步驟 4混合信號(hào)的編碼特征實(shí)際包含了兩個(gè)源信號(hào)編碼特征,每個(gè)源信號(hào)存在潛在的時(shí)域掩模[18],通過時(shí)域掩??梢蕴崛∶總€(gè)源信號(hào)的編碼特征。將得到的每個(gè)源信號(hào)的時(shí)域掩模分別與混合信號(hào)的編碼特征表示相乘,得到兩個(gè)通信源信號(hào)的特征編碼: ssep=xencoder°smask (5) 式中:°表示Hadamard乘積。 對(duì)分離得到的通信源信號(hào)特征編碼,采用1-D卷積反變換,進(jìn)行512維特征解碼,得到一維時(shí)域波形: s*=hdecoder(xsep) (6) 式中:hdecoder(·)為解碼器。 衡量盲源分離性能的基本分離評(píng)價(jià)指標(biāo)通常采用比例不變信噪比(scale-invariant signal to noise ratio,SISNR)[42]。SISNR衡量了信號(hào)與分離誤差的比值關(guān)系,SISNR越高,表明分離誤差越低,分離性能越好。計(jì)算之前將源信號(hào)和分離后的源信號(hào)標(biāo)準(zhǔn)化為零均值,確保尺度不變。 網(wǎng)絡(luò)訓(xùn)練時(shí)一般采用梯度下降法,需要最小化損失函數(shù),因此采用負(fù)的SISNR作為損失函數(shù),如式(7)所示,保證端到端的訓(xùn)練使得損失最小,SISNR最大,以確保模型訓(xùn)練的準(zhǔn)確性。 (7) 通過反向傳播梯度下降算法,進(jìn)行參數(shù)更新: (8) (9) (10) 反向傳播梯度下降算法對(duì)編碼部分、掩膜部分和解碼部分的參數(shù)θ={θencoder,θmask,θdecoder}更新。其中,編碼器參數(shù)集、掩模參數(shù)集、解碼器參數(shù)集分別為θencoder={w1,b1},θmask={w2,b2},θdecoder={w3,b3}。 實(shí)驗(yàn)包括兩部分。第4.1節(jié)為混合信號(hào)在20 dB高信噪比下的分離實(shí)驗(yàn),根據(jù)SISNR損失函數(shù)值,與NMF、ICA算法對(duì)比驗(yàn)證Stacked-TCN方法的分離性能。第4.2節(jié)為不同信噪比的混合信號(hào)的分離實(shí)驗(yàn),驗(yàn)證Stacked-TCN方法的泛化性能與噪聲魯棒性。 實(shí)驗(yàn)采用的硬件資源為Tesla k80 GPU,Intel Xeon E5 2.60 GHz CPU,深度學(xué)習(xí)框架為PyTorch1.4。所有實(shí)驗(yàn)均采用五折交叉驗(yàn)證。 如圖3所示,實(shí)驗(yàn)流程分為兩部分:數(shù)據(jù)生成與混合部分,信號(hào)分離部分。在數(shù)據(jù)生成與混合部分,通過軟件定義無線電平臺(tái)GNUradio[39]生成5種調(diào)制方式BPSK、8 PSK、QAM16、QAM64、PAM4的通信數(shù)據(jù),采樣率為1 MHz,碼速率為125 Ksymbol/s。參照表1中已有研究成果[43-46],結(jié)合仿真平臺(tái)的實(shí)際運(yùn)行效率,選擇的信噪比范圍為5~20 dB,步長為2.5 dB。在仿真中,假定不同來源的混疊信號(hào)具有相同的頻偏和定時(shí)偏差,本文重點(diǎn)討論不同算法中信噪比對(duì)分離效果的影響。 圖3 實(shí)驗(yàn)流程圖Fig.3 Experimental flow chart 表1 單通道盲源分離算法比較Table 1 single-channel blind source separation algorithms 每類信號(hào)在每種信噪比下生成1 000條純凈數(shù)據(jù)信號(hào),每條數(shù)據(jù)含L=32 768個(gè)采樣點(diǎn),即為32.768 ms,滿足分離任務(wù)的長時(shí)依賴性需求。首先,對(duì)純凈信號(hào)的幅值進(jìn)行標(biāo)準(zhǔn)化處理。然后,采用如式(1)所示的線性瞬時(shí)混合模型,進(jìn)行信號(hào)混合。將5種不同調(diào)制方式的信號(hào)兩兩混合,得到10種混合方式的數(shù)據(jù),在每種混合方式中,將同信噪比的信號(hào)進(jìn)行混合。10種混合方式數(shù)據(jù)分別為BPSK_16QAM、8PSK_64QAM、8PSK_PAM4、64QAM_PAM4、BPSK_8PSK、BPSK_64QAM、BPSK_PAM4、8PSK_16QAM、16QAM_64QAM、16QAM_PAM4,作為混合數(shù)據(jù)集,共70 000條樣本。 在分離部分,分為3個(gè)模塊:1-D卷積編碼模塊、分離模塊、1-D卷積解碼模塊。 實(shí)驗(yàn)?zāi)康?Stacked-TCN算法與ICA[7]、NMF[47]兩種經(jīng)典機(jī)器學(xué)習(xí)算法,TasNet[48]、Wave-U-Net[49]兩種深度學(xué)習(xí)方法在高信噪比下(信噪比為20 dB)進(jìn)行對(duì)比分離試驗(yàn),驗(yàn)證在理想的低噪聲信號(hào)傳輸情況下,不同算法的分離性能。5種算法的基本參數(shù)配置如表2所示。 表2 不同算法的參數(shù)配置Table 2 Parameter configuration for different algorithms ICA[7]和NMF[47]作為傳統(tǒng)機(jī)器學(xué)習(xí)方法,是盲源分離領(lǐng)域的兩種經(jīng)典的算法。ICA利用動(dòng)態(tài)嵌入將單通道觀測數(shù)據(jù)轉(zhuǎn)化為多通道數(shù)據(jù)進(jìn)行分離,在正定和超定分離上性能優(yōu)越,在單通道欠定分離方面的分離精度欠佳。NMF根據(jù)Kullback-Leibler散度最小化計(jì)算信源的基本矩陣和系數(shù)矩陣,實(shí)現(xiàn)信號(hào)分離。此類傳統(tǒng)算法相當(dāng)于淺層模型,不提取信號(hào)深層特征。TasNet[48]和Wave-U-Net[49]作為兩種深度學(xué)習(xí)分離方法,可以實(shí)現(xiàn)信號(hào)的單通道盲源分離。TasNet網(wǎng)絡(luò)采用編解碼與分離模塊的三級(jí)結(jié)構(gòu),分離模塊中每個(gè)塊采用長短時(shí)記憶(long short-term memory,LSTM)網(wǎng)絡(luò),其大量參數(shù)顯著增加了其計(jì)算成本。Wave-U-Net網(wǎng)絡(luò)通過重復(fù)進(jìn)行特征圖的下采樣和卷積來處理時(shí)間序列上下文,在不同時(shí)間尺度上組合高級(jí)和低級(jí)特征,卷積產(chǎn)生的每個(gè)特征映射以原始信號(hào)的采樣率作為分辨率,內(nèi)存消耗較高。Stacked-TCN方法在分離模塊采用空洞卷積,參數(shù)量減少,與LSTM相比,下一步計(jì)算無需等待上一步輸出。 實(shí)驗(yàn)結(jié)果如表3所示,可以看出,Stacked-TCN方法損失最低,為-16.05 dB,其次是Wave-U-Net網(wǎng)絡(luò),損失為-13.97 dB,第3是TasNet網(wǎng)絡(luò),損失為-2.55 dB,最后是ICA和NMF算法,損失分別為4.09 dB和7.93 dB。在單通道通信信號(hào)盲源分離任務(wù)中,3種深度學(xué)習(xí)方法在SISNR上的性能明顯優(yōu)于傳統(tǒng)的ICA、NMF盲源分離算法,其中,Stack-TCN方法的分離性能最佳。該算法的損失與其他4種算法相比平均降低了14.93 dB。 圖4給出了Stacked-TCN算法在信噪比為15 dB,隨機(jī)選取200個(gè)點(diǎn)的情況下,10種混合信號(hào)的波形部分結(jié)果圖。可以看出,分離結(jié)果與源信號(hào)具有高度吻合性。這是由于多層的Stacked-TCN充分利用了通信源信號(hào)的深層次特征,深度神經(jīng)網(wǎng)絡(luò)優(yōu)秀的擬合能力在學(xué)習(xí)時(shí)域掩模上發(fā)揮了重要作用。同時(shí),空洞卷積的不同時(shí)間窗口隨層數(shù)遞增,對(duì)通信時(shí)序信號(hào)的長時(shí)依賴性進(jìn)行了建模,融合不同窗口長度特征。 表3 20 dB混合信號(hào)下不同算法的損失值Table 3 Loss value of different algorithms under 20 dB mixture signals dB 圖4 分離信號(hào)波形圖Fig.4 Separated signals waveform diagram 實(shí)驗(yàn)?zāi)康?在信噪比為5~20 dB范圍內(nèi),進(jìn)行對(duì)比分離試驗(yàn),驗(yàn)證在不同噪聲的傳輸情況下,Stacked-TCN算法的泛化性能與噪聲魯棒性。圖5給出了隨著混合信號(hào)信噪比增加,不同算法的損失結(jié)果變化:① 隨著信噪比的增加,Stacked-TCN方法的分離性能隨之呈現(xiàn)增加的趨勢(shì),分離準(zhǔn)確度增加;② 3種深度學(xué)習(xí)方法在不同信噪比下,性能均優(yōu)于兩種機(jī)器學(xué)習(xí)算法ICA和NMF,即便在較低信噪比下,分離精度亦占優(yōu)勢(shì),其中Stacked-TCN與Wave-U-Net效果最為突出,對(duì)于噪聲干擾,魯棒性較強(qiáng);③ Wave-U-Net方法在8PSK_64QAM、64QAM_PAM4兩種混合信號(hào)的分離中,分離效果優(yōu)于Stacked-TCN,但在其他情況下,存在波動(dòng)與不穩(wěn)定性,而Stacked-TCN方法整體較為平穩(wěn),呈現(xiàn)較好的下降趨勢(shì)。 圖5 不同信噪比下的損失變化Fig.5 Loss change under different signal to noise ratios 這是由于NMF和ICA作為模型驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法,本質(zhì)上是淺層模型,適合樣本小、模型精的任務(wù)。然而,單通道盲源分離作為先驗(yàn)知識(shí)極少的難點(diǎn)問題,淺層模型不足以刻畫其本質(zhì)特征,未能充分利用信號(hào)的深層特征與信息,在泛化為大數(shù)據(jù)能力上較弱,因此在單通道極端病態(tài)條件下,分離性能不佳。當(dāng)任務(wù)復(fù)雜,無法用模型驅(qū)動(dòng)的方法精確刻畫時(shí),數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)方法可以彌補(bǔ)模型上的困難,從大量樣本中學(xué)習(xí)到深層本質(zhì)特征,具有強(qiáng)大的擬合能力,滿足信號(hào)分離等任務(wù)的需求。因此,Stacked-TCN、Wave-U-Net、TasNet的分離效果優(yōu)于ICA和NMF。其中,TasNet網(wǎng)絡(luò)采用LSTM作為block,大量參數(shù)增加了計(jì)算成本,為保證合理的網(wǎng)絡(luò)模型和計(jì)算速度,需控制block的數(shù)量,對(duì)時(shí)序信號(hào)的建模準(zhǔn)確性不夠,因此效果較差。Wave-U-Net網(wǎng)絡(luò)通過重復(fù)進(jìn)行特征圖的下采樣和卷積來處理時(shí)間序列上下文,效果較好,但存在波動(dòng)。Stacked-TCN方法在分離模塊采用空洞卷積和,參數(shù)量減少,同等網(wǎng)絡(luò)模型大小,可以增加block的重復(fù)次數(shù),同時(shí)深度可分離卷積保證了不同窗口尺度信息的融合,因此在3種深度學(xué)習(xí)方法中,其準(zhǔn)確性和穩(wěn)定性上最優(yōu)。 此外,計(jì)算了Stacked-TCN時(shí)域掩模法與時(shí)-頻域掩模法每幀的計(jì)算時(shí)間,如表4所示,大多數(shù)時(shí)-頻域掩模方法的信號(hào)分離研究中,STFT的窗口長度至少為256點(diǎn)[9-12],因此本實(shí)驗(yàn)單幀時(shí)長取為 0.256 ms,其計(jì)算時(shí)間為1.24 ms,較長的時(shí)間窗和計(jì)算時(shí)間,使得系統(tǒng)最低時(shí)延增加。而Stacked-TCN時(shí)域掩模法在不降低分離準(zhǔn)確度的前提下,單幀時(shí)長可降至0.032 ms,其計(jì)算時(shí)間僅為7.90×10-3ms,具有較低的系統(tǒng)最小延遲。時(shí)-頻域掩模法要成功地從時(shí)-頻表示中分離源信號(hào),需要混合信號(hào)的高分辨率頻率分解,這需要較長的STFT時(shí)間窗,該要求增加了系統(tǒng)的最小延遲,限制了其在實(shí)時(shí)及低延遲應(yīng)用中的適用性,因此越來越多的研究開始轉(zhuǎn)向時(shí)域方法[18-31]。 表4 處理每幀所用時(shí)間Table 4 Times per frame ms 表5給出了不同算法分離混合信號(hào)的速度,在單樣本的分離速度方面,時(shí)域分離方法中,NMF>ICA>Wave-UNet>TasNet>Stacked-TCN,NMF和ICA算法運(yùn)行較快,但未對(duì)信號(hào)充分建模,犧牲了分離準(zhǔn)確度。Wave-UNet、TasNet、Stacked-TCN運(yùn)行速度相當(dāng)。由于樣本的長時(shí)采樣點(diǎn)在Stacked-TCN中得到了充分利用,使得分離性能提高。 表5 分離混合信號(hào)所用時(shí)間Table 5 Times of separation s 基于深度學(xué)習(xí)框架Stacked-TCN的單通道通信信號(hào)盲源分離,免去了繁雜的特征工程,具有良好的泛化性能,克服了ICA、NMF等傳統(tǒng)機(jī)器學(xué)習(xí)方法的泛化大數(shù)據(jù)能力弱的缺陷,解決了單通道分離中可行解爆炸問題。分離模塊采用深度可分離卷積,卷積核為空洞卷積,減少了參數(shù)量,在分離之前提取信號(hào)的多尺度窗口深層特征以學(xué)習(xí)源信號(hào)的掩模,與TasNet和Wave-U-Net網(wǎng)絡(luò)相比,具有較小的網(wǎng)絡(luò)規(guī)模和更優(yōu)的分離性能。 實(shí)驗(yàn)結(jié)果表明,該方法能夠用于常見調(diào)制方式的混合信號(hào)分離,其損失函數(shù)比其他4種方法降低了9.11~36.63 dB。其意義體現(xiàn)在以下3方面:① 在5 dB低信噪比下,具備良好的分離性能和噪聲魯棒性;② 在保證分離精度的同時(shí),具有較短的單幀處理時(shí)長和較低的系統(tǒng)最小延遲;③ 通過與信號(hào)處理系統(tǒng)的結(jié)合,提高前端處理模塊的混疊信號(hào)分離精度。2 Gonv-TasNet
2.1 混合信號(hào)編碼特征表示
2.2 源信號(hào)掩模生成
2.3 源信號(hào)波形恢復(fù)
3 網(wǎng)絡(luò)訓(xùn)練
4 實(shí)驗(yàn)與結(jié)果分析
4.1 實(shí)驗(yàn)條件
4.2 實(shí)驗(yàn)1:信噪比為20 dB下的算法性能對(duì)比
4.3 實(shí)驗(yàn)2:信噪比為5~20 dB時(shí)的對(duì)比實(shí)驗(yàn)
5 結(jié) 論