呂昊遠(yuǎn),俞 璐,陳 璞
(陸軍工程大學(xué) 通信工程學(xué)院,南京 210007)
在現(xiàn)代戰(zhàn)爭(zhēng)日趨復(fù)雜的電磁環(huán)境空間中,電子對(duì)抗發(fā)揮著舉足輕重的作用。作為重要的非合作識(shí)別手段,電子偵察是電子對(duì)抗的基礎(chǔ)和前提[1]。電子偵察手段將獲取通信輻射源信號(hào)數(shù)據(jù)的幅度、脈寬、載頻等參數(shù)經(jīng)過(guò)處理,得到通信輻射源目標(biāo)的信息,從而做到對(duì)于信息制取權(quán)的實(shí)時(shí)掌握[2]。
隨著技術(shù)的不斷發(fā)展,新型多功能輻射源信號(hào)參數(shù)呈現(xiàn)出多變性,信號(hào)樣式也變得越來(lái)越復(fù)雜,不同模式、個(gè)體間的信號(hào)參數(shù)交錯(cuò),對(duì)于輻射源目標(biāo)的識(shí)別,傳統(tǒng)電子偵察識(shí)別方法就愈加困難。為了能夠準(zhǔn)確地識(shí)別、干擾、打擊敵方目標(biāo),首要環(huán)節(jié)就是做到輻射源個(gè)體區(qū)分,由此提出輻射源個(gè)體識(shí)別(SEI,specific emitter identification)技術(shù)[3]?!皞€(gè)體特征”就是由通信設(shè)備內(nèi)部的不同制造工藝而導(dǎo)致所發(fā)射信號(hào)的細(xì)微差異。輻射源個(gè)體識(shí)別技術(shù)通過(guò)測(cè)量手段獲取信號(hào)的外部特征,提取出反映目標(biāo)身份的信息,確定發(fā)射所得信號(hào)的特定輻射源個(gè)體[4]。
作為人工智能領(lǐng)域近十年來(lái)最受關(guān)注的技術(shù)之一,深度學(xué)習(xí)通過(guò)深度神經(jīng)網(wǎng)絡(luò)將底層的特征映射到高層,并且通過(guò)高層將特征抽象出來(lái),從而發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示[5]。深度學(xué)習(xí)的快速發(fā)展為通信輻射源個(gè)體識(shí)別提供了新的處理思路和研究方法,深度學(xué)習(xí)直接從輸入的信號(hào)數(shù)據(jù)中提取個(gè)體特征,跨越人工設(shè)計(jì)特征階段[6],應(yīng)用在輻射源個(gè)體識(shí)別問(wèn)題中可以節(jié)省大量科研成本。
深度網(wǎng)絡(luò)訓(xùn)練需要龐大的數(shù)據(jù)集,但在實(shí)際環(huán)境中獲取到具有標(biāo)簽信息的信號(hào)樣本數(shù)量非常有限,“小樣本”問(wèn)題嚴(yán)重制約了通信輻射源個(gè)體識(shí)別技術(shù)的應(yīng)用與發(fā)展[7],在這種情況下,深度學(xué)習(xí)方法中引入半監(jiān)督的思想,充分利用大量無(wú)標(biāo)簽信號(hào)樣本內(nèi)在的結(jié)構(gòu)信息提取通信輻射源個(gè)體本征特征,從半監(jiān)督學(xué)習(xí)的角度提高通信輻射源個(gè)體識(shí)別技術(shù)的性能,這在信號(hào)偵察對(duì)抗和無(wú)線電監(jiān)視管控等領(lǐng)域具有重大的研究意義和應(yīng)用價(jià)值[8]。
先前的研究工作中,基于端到端半監(jiān)督深度學(xué)習(xí)的通信輻射源個(gè)體識(shí)別技術(shù)研究較少。黃健航[9]提出的通信輻射源個(gè)體識(shí)別方法用到了半監(jiān)督矩形網(wǎng)絡(luò)[10],茍嫣[11]提出的遷移極限學(xué)習(xí)機(jī)采用基于實(shí)例的遷移學(xué)習(xí)方法。半監(jiān)督學(xué)習(xí)方面,Lee[12]提出的基于偽標(biāo)簽的半監(jiān)督深度學(xué)習(xí)方法將偽標(biāo)簽訓(xùn)練機(jī)制加入到深度卷積神經(jīng)網(wǎng)絡(luò)中,在MNI-ST圖像數(shù)據(jù)集中達(dá)到較高的識(shí)別準(zhǔn)確率。
本文在偽標(biāo)簽半監(jiān)督方法的基礎(chǔ)上,提出一種基于偽標(biāo)簽半監(jiān)督深度學(xué)習(xí)的通信輻射源個(gè)體識(shí)別方法,并在生成偽標(biāo)簽中使用加權(quán)平均的思想進(jìn)行改進(jìn),在5臺(tái)同型號(hào)USRP輻射源采集的數(shù)據(jù)集上驗(yàn)證算法的魯棒性。并與全監(jiān)督方法和改進(jìn)前的偽標(biāo)簽半監(jiān)督方法進(jìn)行比對(duì),實(shí)驗(yàn)結(jié)果顯示,改進(jìn)后的偽標(biāo)簽半監(jiān)督算法在少量有標(biāo)簽信號(hào)樣本條件下能夠達(dá)到更好的識(shí)別性能。
在基于偽標(biāo)簽的半監(jiān)督學(xué)習(xí)方法中,深度網(wǎng)絡(luò)以有監(jiān)督的方式同時(shí)訓(xùn)練有標(biāo)簽和無(wú)標(biāo)簽數(shù)據(jù)。對(duì)于無(wú)標(biāo)簽數(shù)據(jù),使用網(wǎng)絡(luò)的預(yù)測(cè)輸出作為其偽標(biāo)簽,加入到網(wǎng)絡(luò)中再次訓(xùn)練,充分挖掘出無(wú)標(biāo)簽樣本中與有標(biāo)簽樣本完全相同的個(gè)體信息,最終在測(cè)試集上取得較好的識(shí)別效果[13]。
本章分別介紹半監(jiān)督學(xué)習(xí)的思想和基于偽標(biāo)簽的半監(jiān)督深度學(xué)習(xí)方法,并引入熵正則化的概念,從理論方面說(shuō)明偽標(biāo)簽方法的有效性。
相比于稀缺的有標(biāo)簽樣本,無(wú)標(biāo)簽樣本數(shù)量眾多且相對(duì)容易獲取。為了能夠有效利用寶貴的有標(biāo)簽樣本,也為了使大量且相對(duì)便宜的無(wú)標(biāo)簽樣本不至于浪費(fèi)而發(fā)揮出最大效用,研究學(xué)者們提出了半監(jiān)督學(xué)習(xí)技術(shù)[14]。
通過(guò)近些年的不斷探索發(fā)展,半監(jiān)督學(xué)習(xí)已經(jīng)成為機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)。它的基本思想是使用大量無(wú)標(biāo)簽樣本輔助少量有標(biāo)簽樣本進(jìn)行學(xué)習(xí),達(dá)到提高學(xué)習(xí)效果的目的[15]。如圖1(a)所示,有4個(gè)分屬于兩個(gè)不同類別的有標(biāo)簽樣本點(diǎn),當(dāng)僅考慮這4個(gè)有標(biāo)簽樣本點(diǎn)時(shí),只能假設(shè)出線性決策邊界,但如果考慮到數(shù)量較多的無(wú)標(biāo)簽樣本點(diǎn)(白色圖形)時(shí),如圖1(b)所示,就可以繪制出正確的非線性決策邊界而確定真正的樣本分布。
圖1 半監(jiān)督學(xué)習(xí)示意圖
因此,在半監(jiān)督學(xué)習(xí)中,結(jié)合使用稀少的有標(biāo)簽和海量無(wú)標(biāo)簽樣本,得到更精確的決策邊界來(lái)提高模型的推廣性能[16]。
偽標(biāo)簽就是對(duì)于無(wú)標(biāo)簽樣本數(shù)據(jù),通過(guò)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果,賦予其標(biāo)簽值。賦標(biāo)簽值時(shí)只選擇對(duì)每個(gè)未標(biāo)記樣本具有最大預(yù)測(cè)概率的類別。
(1)
再以有監(jiān)督的方式同時(shí)使用有標(biāo)簽和無(wú)標(biāo)簽數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。對(duì)于未標(biāo)記的數(shù)據(jù),其偽標(biāo)簽值要隨著網(wǎng)絡(luò)權(quán)值的變化而不斷更新[17]。由于偽標(biāo)簽的可信度以及有標(biāo)簽數(shù)據(jù)和無(wú)標(biāo)簽數(shù)據(jù)的數(shù)量規(guī)模的差距,兩部分損失之間的平衡對(duì)于網(wǎng)絡(luò)訓(xùn)練的性能至關(guān)重要,因此整體損失函數(shù)為:
(2)
C是類別數(shù),n是有標(biāo)簽樣本數(shù)目,n′是無(wú)標(biāo)簽樣本數(shù)目,L是交叉熵?fù)p失函數(shù),f是神經(jīng)網(wǎng)絡(luò)對(duì)于有標(biāo)簽樣本的輸出預(yù)測(cè),y是對(duì)應(yīng)的標(biāo)簽,f′是神經(jīng)網(wǎng)絡(luò)對(duì)于無(wú)標(biāo)簽樣本的輸出預(yù)測(cè),y′是其對(duì)應(yīng)的偽標(biāo)簽。α(t)是平衡兩部分損失權(quán)重的系數(shù)函數(shù),t是當(dāng)前的迭代輪次。
在訓(xùn)練過(guò)程中。α(t)決定著無(wú)標(biāo)簽數(shù)據(jù)損失部分在整體損失中所占比重的大小。在訓(xùn)練初始階段,因?yàn)榫W(wǎng)絡(luò)輸出預(yù)測(cè)不夠準(zhǔn)確,所以賦予的偽標(biāo)簽值準(zhǔn)確性較低,此時(shí)如果α(t)值過(guò)大,增大無(wú)標(biāo)簽數(shù)據(jù)損失權(quán)重會(huì)導(dǎo)致訓(xùn)練性能退化,但α(t)值太小就不能充分利用無(wú)標(biāo)簽數(shù)據(jù)的好處,對(duì)于網(wǎng)絡(luò)性能提升有限。設(shè)置α(t)為退火過(guò)程,初始值為0,再隨著訓(xùn)練迭代次數(shù)的增加而緩慢增長(zhǎng)并最終固定,網(wǎng)絡(luò)的預(yù)測(cè)能力也會(huì)隨之增強(qiáng)[18]。
(3)
T1為加入無(wú)標(biāo)簽損失時(shí)的起始輪次值,T2為權(quán)重固定的輪次值,αf為最終無(wú)標(biāo)簽損失部分的權(quán)重固定值,3個(gè)值的設(shè)置需要在實(shí)驗(yàn)中結(jié)合具體應(yīng)用場(chǎng)景設(shè)置。這個(gè)退火過(guò)程的設(shè)置可以使得優(yōu)化中避免較差的局部最小值,使得無(wú)標(biāo)簽數(shù)據(jù)的偽標(biāo)簽盡可能地類似于真實(shí)標(biāo)簽。
理想的深度網(wǎng)絡(luò)模型中,不同的輻射源信號(hào)在特征空間分類邊界上密度較小,而來(lái)自同一個(gè)輻射源的信號(hào)特征距離較近、密度較大并且具有連續(xù)性。熵正則化從這個(gè)思想出發(fā),在最大后驗(yàn)估計(jì)框架下充分利用無(wú)標(biāo)簽信號(hào)樣本[19]。熵正則化通過(guò)最小化無(wú)標(biāo)簽數(shù)據(jù)類別的條件熵來(lái)支持類之間的低密度分離,其表示形式如下:
(4)
(5)
n是有標(biāo)簽信號(hào)樣本的數(shù)量,xm是第m個(gè)有標(biāo)簽信號(hào)樣本,λ是權(quán)重系數(shù)平衡兩部分。熵正則化的意義在于讓模型對(duì)于無(wú)標(biāo)簽信號(hào)樣本的識(shí)別概率盡可能地集中在某一類,減小決策邊界附近的信號(hào)密度。通過(guò)最大化有標(biāo)簽信號(hào)數(shù)據(jù)的條件對(duì)數(shù)似然和最小化無(wú)標(biāo)簽樣本的熵,使得深度網(wǎng)絡(luò)的泛化能力增強(qiáng)。通過(guò)比較式(5)和式(2)可以看得,前文所提的偽標(biāo)簽方法相當(dāng)于熵正則化,式(5)中的前后兩項(xiàng)分別對(duì)應(yīng)式(2)中的前后兩項(xiàng),權(quán)重系數(shù)λ對(duì)應(yīng)于α。
基于偽標(biāo)簽半監(jiān)督深度學(xué)習(xí)的通信輻射源個(gè)體識(shí)別方法訓(xùn)練流程如圖2所示。
圖2 訓(xùn)練流程
首先初始化深度網(wǎng)絡(luò)的參數(shù),少量有標(biāo)簽和大量無(wú)標(biāo)簽信號(hào)樣本構(gòu)成算法的輸入數(shù)據(jù),接著開始訓(xùn)練樣本數(shù)據(jù),由于在訓(xùn)練初始階段模型的預(yù)測(cè)準(zhǔn)確率不高,偽標(biāo)簽的可信度非常低,所以當(dāng)訓(xùn)練周期數(shù)小于T1時(shí),只計(jì)算有標(biāo)簽數(shù)據(jù)部分的損失值。當(dāng)模型訓(xùn)練到一定階段(周期數(shù)大于T1)時(shí),網(wǎng)絡(luò)的預(yù)測(cè)能力增強(qiáng),這時(shí)偽標(biāo)簽信息相對(duì)可信,結(jié)合有標(biāo)簽和無(wú)標(biāo)簽信號(hào)樣本兩部分損失,構(gòu)建整體損失函數(shù),并根據(jù)式(3),在接下來(lái)的訓(xùn)練中,動(dòng)態(tài)調(diào)整兩部分損失的權(quán)重系數(shù)。
偽標(biāo)簽原算法在一輪迭代中,將網(wǎng)絡(luò)的輸出預(yù)測(cè)值強(qiáng)銳化作為樣本的偽標(biāo)簽,然后在同一輪中計(jì)算輸出預(yù)測(cè)和偽標(biāo)簽的損失值,這對(duì)于本實(shí)驗(yàn)的輻射源信號(hào)數(shù)據(jù)而言,在訓(xùn)練初期偽標(biāo)簽的優(yōu)劣條件下都存在問(wèn)題(具體如表1所示)。本文引入加權(quán)平均的思想,提出改進(jìn)的輪次標(biāo)簽法。
圖3 輪次標(biāo)簽
輪次標(biāo)簽法在訓(xùn)練初期,有效增強(qiáng)了偽標(biāo)簽的質(zhì)量,提升了網(wǎng)絡(luò)模型的魯棒性,具體的算法改進(jìn)前后,在預(yù)測(cè)正確和錯(cuò)誤兩種情形下的比較如表1所示。
表1 算法改進(jìn)前后比較
在訓(xùn)練過(guò)程每個(gè)周期內(nèi),網(wǎng)絡(luò)對(duì)于無(wú)標(biāo)簽信號(hào)樣本都要預(yù)測(cè)標(biāo)簽值,將加權(quán)平均結(jié)果作為其偽標(biāo)簽,然后就可以作為有標(biāo)簽信號(hào)樣本,加入到訓(xùn)練集中重復(fù)訓(xùn)練,直至訓(xùn)練周期達(dá)到預(yù)設(shè)值結(jié)束。
根據(jù)輸入信號(hào)樣本的形式,以及對(duì)網(wǎng)絡(luò)的需求關(guān)系,設(shè)計(jì)出如圖4所示的CNN模型,除輸入輸出層外,中間的特征提取過(guò)程包括兩個(gè)卷積層和兩個(gè)全連接層。具體的信號(hào)樣本劃分,構(gòu)建數(shù)據(jù)集會(huì)在下一章中說(shuō)明。
圖4 CNN結(jié)構(gòu)圖
網(wǎng)絡(luò)的輸入樣本維數(shù)為 2×128,兩個(gè)卷積層的核數(shù)量分別為 32,16,大小分別是(1,3),(2,3)。第一個(gè)全連接層的神經(jīng)元個(gè)數(shù)為 128,第二個(gè)全連接層神經(jīng)元個(gè)數(shù)為5,對(duì)應(yīng)5個(gè)輻射源個(gè)體的5分類問(wèn)題,最后通過(guò)softmax層輸出預(yù)測(cè)值。除最后一層使用softmax激活函數(shù),其余層使用ReLU激活函數(shù)。并且在每層后會(huì)連接至dropout層進(jìn)行正則化,參數(shù)設(shè)置為 0.1,實(shí)驗(yàn)選用交叉熵?fù)p失函數(shù)和Adam優(yōu)化器。
為了評(píng)估基于偽標(biāo)簽半監(jiān)督深度學(xué)習(xí)算法對(duì)于通信輻射源個(gè)體識(shí)別問(wèn)題的可行性與有效性,在實(shí)驗(yàn)室條件下,采用6臺(tái)USRP N210設(shè)備作為信號(hào)樣本采集的輻射源,其中5臺(tái)作為發(fā)射端,固定1臺(tái)為接收端,在采取的輻射源信號(hào)上實(shí)驗(yàn)驗(yàn)證。
發(fā)送端和接收端程序采用LabVIEW軟件實(shí)現(xiàn),USRP通過(guò)網(wǎng)絡(luò)電纜與計(jì)算機(jī)相連[20]。所采集的數(shù)據(jù)是相互正交的IQ兩路載波信號(hào)。采集數(shù)據(jù)過(guò)程中設(shè)置頻率帶寬為1 GHz,采樣頻率為1 MHz。
對(duì)采集到的通信輻射源信號(hào)進(jìn)行預(yù)處理制作成數(shù)據(jù)樣本集,去除采樣幀初始階段幀與幀切換時(shí)產(chǎn)生的不規(guī)則樣本點(diǎn),并且進(jìn)行功率歸一化比例變換,再設(shè)置5類標(biāo)簽值,將輻射源個(gè)體類別進(jìn)行標(biāo)號(hào)。
將所采集到的信號(hào)樣本按照一定比例劃分為訓(xùn)練集和測(cè)試集,并且選取訓(xùn)練集中的少量樣本作為有標(biāo)簽訓(xùn)練集,和大量樣本作為無(wú)標(biāo)簽訓(xùn)練集。設(shè)置有標(biāo)簽信號(hào)樣本數(shù)為1 000和2 000。有標(biāo)簽信號(hào)樣本與無(wú)標(biāo)簽信號(hào)樣本的比例大小為(1:3)。測(cè)試集的樣本數(shù)為500。
本文使用深度學(xué)習(xí)框架PyTorch實(shí)現(xiàn)對(duì)深度神經(jīng)網(wǎng)絡(luò)的構(gòu)建以及算法的訓(xùn)練與測(cè)試。計(jì)算機(jī)系統(tǒng)環(huán)境為Windows10-64-bit,開發(fā)環(huán)境為anaconda+pytorch+pycharm,軟硬件環(huán)境配置如表2所示。
表2 軟硬件環(huán)境
半監(jiān)督訓(xùn)練過(guò)程中,設(shè)置200次的迭代次數(shù),根據(jù)多次實(shí)驗(yàn)效果,設(shè)置T1的值為30,T2的值為180,αf的值為0.2。
圖5~8分別繪制在不同有標(biāo)簽信號(hào)樣本數(shù)量條件下,訓(xùn)練過(guò)程中訓(xùn)練樣本的損失函數(shù)和識(shí)別準(zhǔn)確率隨著迭代次數(shù)增加的變化曲線。識(shí)別準(zhǔn)確率包括全監(jiān)督訓(xùn)練和半監(jiān)督訓(xùn)練,半監(jiān)督訓(xùn)練中又分為有標(biāo)簽信號(hào)樣本和無(wú)標(biāo)簽信號(hào)樣本兩部分,其中無(wú)標(biāo)簽樣本的原有標(biāo)簽值只用在每次迭代后計(jì)算樣本的識(shí)別準(zhǔn)確率,不投入深度網(wǎng)絡(luò)指導(dǎo)訓(xùn)練。
圖5 1 000個(gè)有標(biāo)簽樣本的訓(xùn)練過(guò)程中的損失值
可以看出,當(dāng)?shù)螖?shù)小于T1時(shí),兩種訓(xùn)練方式的損失和準(zhǔn)確率的變化趨勢(shì)一致,當(dāng)?shù)螖?shù)為T1時(shí),半監(jiān)督訓(xùn)練過(guò)程中由于加入了無(wú)標(biāo)簽信號(hào)樣本這部分損失值,整體的訓(xùn)練損失值產(chǎn)生波動(dòng),在T2之后逐漸趨于穩(wěn)定。與全監(jiān)督訓(xùn)練比較,因?yàn)榘氡O(jiān)督訓(xùn)練中使用了更多的無(wú)標(biāo)簽信號(hào)樣本,所以損失值收斂的速度更慢波動(dòng)更大,且隨著無(wú)標(biāo)簽信號(hào)樣本的數(shù)量增多,這一現(xiàn)象會(huì)更加明顯。半監(jiān)督訓(xùn)練過(guò)程,相比較于有標(biāo)簽信號(hào)樣本,無(wú)標(biāo)簽信號(hào)樣本的識(shí)別準(zhǔn)確度較低,這是因?yàn)橛袠?biāo)簽信號(hào)樣本在訓(xùn)練過(guò)程中使用了真實(shí)標(biāo)簽值,而無(wú)標(biāo)簽信號(hào)樣本而無(wú)標(biāo)簽信號(hào)樣本在訓(xùn)練過(guò)程中使用的偽標(biāo)簽值與真實(shí)標(biāo)簽值還存在著一些差異。
圖6 1 000個(gè)有標(biāo)簽樣本的訓(xùn)練過(guò)程中的準(zhǔn)確率
圖7 2 000個(gè)有標(biāo)簽樣本的訓(xùn)練過(guò)程中的損失值
圖8 2 000個(gè)有標(biāo)簽樣本的訓(xùn)練過(guò)程中的準(zhǔn)確率
圖9和圖10將兩種條件下測(cè)試集的識(shí)別結(jié)果用混淆矩陣展示,顏色表示識(shí)別程度,顏色越深表示識(shí)別為此類的概率越大?;煜仃噷?duì)角線上的數(shù)據(jù)表示被正確分類的準(zhǔn)確率,其余表示被錯(cuò)誤分類,由此可見(jiàn),改進(jìn)的偽標(biāo)簽半監(jiān)督方法在測(cè)試集上分別達(dá)到了88.92%和94.14%的識(shí)別準(zhǔn)確率,第二類輻射源的識(shí)別準(zhǔn)確率最高,相比之下,第一類輻射源與第三類輻射源的差別較小,在識(shí)別過(guò)程中有一定的識(shí)別難度。
圖9 有標(biāo)簽樣本數(shù)為1 000的混淆矩陣
圖10 有標(biāo)簽樣本數(shù)為2 000的混淆矩陣
設(shè)置有標(biāo)簽和無(wú)標(biāo)簽信號(hào)樣本數(shù)比例,并與兩種有標(biāo)簽樣本數(shù)構(gòu)建不同的組合方式,如表3和表4所示,通過(guò)100次蒙特卡洛實(shí)驗(yàn)最終得出不同設(shè)置條件下全監(jiān)督方法,原偽標(biāo)簽半監(jiān)督方法和改進(jìn)后的偽標(biāo)簽半監(jiān)督方法的識(shí)別準(zhǔn)確率,其中帶*的為改進(jìn)后的偽標(biāo)簽半監(jiān)督方法。
表3 1 000標(biāo)簽數(shù)時(shí)的識(shí)別準(zhǔn)確率
表4 2 000標(biāo)簽數(shù)時(shí)的識(shí)別準(zhǔn)確率
全監(jiān)督訓(xùn)練過(guò)程中只用到有標(biāo)簽樣本,所以改變有標(biāo)簽訓(xùn)練樣本所占比其值不變。全監(jiān)督方法受標(biāo)簽數(shù)目影響較大,當(dāng)標(biāo)簽數(shù)目較少時(shí),測(cè)試集的識(shí)別準(zhǔn)確率較低,加入無(wú)標(biāo)簽樣本的半監(jiān)督在標(biāo)簽數(shù)目較少的情況下,取得了較高的識(shí)別準(zhǔn)確率,相比于原偽標(biāo)簽方法,改進(jìn)后的偽標(biāo)簽方法識(shí)別準(zhǔn)確率得到提升。
一定范圍內(nèi)當(dāng)無(wú)標(biāo)簽樣本數(shù)所占比增大時(shí),半監(jiān)督學(xué)習(xí)的識(shí)別準(zhǔn)確率會(huì)增大,實(shí)驗(yàn)中發(fā)現(xiàn)有標(biāo)簽樣本和無(wú)標(biāo)簽樣本數(shù)目為(1:3)時(shí)效果最好,但如果繼續(xù)增大無(wú)標(biāo)簽數(shù)目,模型的識(shí)別性能反而會(huì)下降,且結(jié)果具有波動(dòng)性,這是因?yàn)檫^(guò)多的無(wú)標(biāo)簽樣本會(huì)使生成錯(cuò)誤偽標(biāo)簽的概率增大,訓(xùn)練過(guò)程中就會(huì)受到錯(cuò)誤的偽標(biāo)簽影響使得識(shí)別準(zhǔn)確率降低。
當(dāng)標(biāo)簽數(shù)目較多時(shí),全監(jiān)督和半監(jiān)督方法的識(shí)別準(zhǔn)確率相差較小,這也說(shuō)明了,只有在標(biāo)簽信號(hào)樣本數(shù)目較少的情況下,偽標(biāo)簽半監(jiān)督學(xué)習(xí)在訓(xùn)練過(guò)程中才更能體現(xiàn)出避免過(guò)擬合增強(qiáng)魯棒的特性。
本文提出了一種基于偽標(biāo)簽半監(jiān)督深度學(xué)習(xí)的通信輻射源個(gè)體識(shí)別方法,介紹了偽標(biāo)簽半監(jiān)督深度學(xué)習(xí)方法的提出背景、理論基礎(chǔ)和算法過(guò)程,并且根據(jù)加權(quán)平均的思想加入了輪次標(biāo)簽法。對(duì)比分析改進(jìn)的偽標(biāo)簽半監(jiān)督方法與全監(jiān)督方法和原有的偽標(biāo)簽半監(jiān)督方法在5臺(tái)USRP輻射源數(shù)據(jù)集上的訓(xùn)練過(guò)程和分類結(jié)果,當(dāng)有標(biāo)簽信號(hào)樣本數(shù)為1 000和2 000,所占樣本總數(shù)的四分之一時(shí),分別得到88.92%和94.14%的識(shí)別準(zhǔn)確率,證明了在少標(biāo)簽樣本條件下的輻射源個(gè)體識(shí)別問(wèn)題上有著很好的應(yīng)用效果。在后續(xù)的工作中,將對(duì)于偽標(biāo)簽質(zhì)量的提高,深度網(wǎng)絡(luò)結(jié)構(gòu)改進(jìn)等方面繼續(xù)深入研究探索。