馬永濤,王煜東
(天津大學(xué)微電子學(xué)院,天津 300072)
近年來,無(wú)線通信業(yè)務(wù)快速增長(zhǎng),造成無(wú)線電頻譜資源相對(duì)匱乏。無(wú)線電波非視距傳播的特性決定了無(wú)線設(shè)備適合使用3 GHz以下的頻段,頻譜固定分配機(jī)制雖然在一定歷史時(shí)期保證了通信系統(tǒng)的穩(wěn)定性能,同時(shí)也造成3 GHz以下的頻段被分配殆盡[1]。美國(guó)通信聯(lián)邦委員會(huì)(Federal Communications Commission)的研究表明,已授權(quán)頻譜的頻譜利用率只有15%~85%[2]。由于大量授權(quán)用戶(Primary User,PU)對(duì)于授權(quán)頻段的使用不是連續(xù)的,因此在許多時(shí)間段上存在大量頻譜空穴[3],但是固定的頻譜分配政策使未授權(quán)用戶無(wú)法使用這些頻譜空穴,造成了授權(quán)頻段無(wú)線電資源的浪費(fèi)與公共頻段的擁擠不堪。認(rèn)知無(wú)線電[4-5](Cognitive Radio,CR)是一種通過使SU利用頻譜空穴提高頻譜利用率的技術(shù)。
頻譜感知是認(rèn)知無(wú)線電的核心技術(shù),通過頻譜感知,SU能夠檢測(cè)頻譜空穴并使用它們,同時(shí)也避免對(duì)PU產(chǎn)生干擾,是保證高效分配頻譜資源的先決條件。初期頻譜感知基于單節(jié)點(diǎn)[6-7]進(jìn)行,但由于單節(jié)點(diǎn)容易受到陰影、衰落等影響導(dǎo)致感知效果急劇降低,協(xié)作頻譜感知[7-10]被提出。
在頻譜感知中,能量檢測(cè)[11-14]方法由于復(fù)雜度低、檢測(cè)速度快等優(yōu)點(diǎn)而受到研究者的青睞。能量檢測(cè)方法通過實(shí)時(shí)計(jì)算信號(hào)能量,與判決門限進(jìn)行比較,判斷PU是否占用通信信道。隨著機(jī)器學(xué)習(xí)的興起,研究者們把機(jī)器學(xué)習(xí)[15-19]應(yīng)用于頻譜感知。文獻(xiàn)[15]中,研究者在協(xié)作頻譜感知中采用了K-Mediods聚類算法,通過詳細(xì)的數(shù)學(xué)推理與研究,證明了聚類算法在協(xié)作頻譜感知中對(duì)于抵抗干擾數(shù)據(jù)的積極作用。文獻(xiàn)[16]針對(duì)多個(gè)PU存在的CRN中的信號(hào)檢測(cè)與識(shí)別,研究了基于糾錯(cuò)輸出碼的多類SVM算法,解決了包含多PU的CRN中頻譜感知問題。文獻(xiàn)[17]針對(duì)低信噪比下頻譜感知存在的問題,以信號(hào)的協(xié)方差矩陣的最大特征值和最小特征值之間的差異作為特征值,采用RBF核函數(shù)的SVM算法,提高了頻譜感知的性能。文獻(xiàn)[18]針對(duì)規(guī)模較大的CRN,提出了一種基于SVM的協(xié)作頻譜感知算法,通過對(duì)用戶分組,有效降低了協(xié)作感知的成本。文獻(xiàn)[19-20]針對(duì)頻譜感知中噪聲不確定引起感知效果下降的問題,研究了基于模糊支持向量機(jī)的協(xié)作頻譜感知算法。
圖1 頻譜感知技術(shù)分類
本文提出一種適用于機(jī)器學(xué)習(xí)的二維概率向量,通過對(duì)能量向量進(jìn)行數(shù)據(jù)處理,將其轉(zhuǎn)化為主用戶占用頻段的概率,降低數(shù)據(jù)維數(shù)以提高在CRN中進(jìn)行協(xié)作頻譜感知的效果。本文研究了在K-Mediods與FSVM中分別使用能量向量與概率向量的性能表現(xiàn)。實(shí)驗(yàn)結(jié)果表明,采用該二維向量,有效降低了機(jī)器學(xué)習(xí)算法中的訓(xùn)練時(shí)間與分類延遲。
本文采用能量檢測(cè)感知信號(hào)能量,首先對(duì)采樣信號(hào)x(n)進(jìn)行模平方得到|x(n)|2,通過求和運(yùn)算得到信號(hào)能量值Y。能量檢測(cè)流程如圖2所示。
圖2 能量檢測(cè)流程圖
圖3 1個(gè)PU與多個(gè)SU組成的CRN
(1)
對(duì)于帶寬為w的信號(hào),采樣頻率為fs=2w,能量檢測(cè)的持續(xù)時(shí)間為τ,能量檢測(cè)采樣的樣本數(shù)量為W=fsτ。第j個(gè)SU檢測(cè)到的原始信號(hào)能量Yj′(n)為:
(2)
對(duì)Yj′(n)進(jìn)行處理,使:
(3)
式中:η=E[|wj(n)|2]=σ2。由于接收信號(hào)yj(n)具有高斯分布,Yj′(n)遵循卡方分布Yj(n)也遵循卡方分布。設(shè)在假設(shè)H0中Yj(n)的平均值為μYj|H0,則有:
(4)
相應(yīng)地,由于E[s(n)w(n)]=0,在假設(shè)H1中,Yj(n)的平均值為μYj|H1,有:
(5)
(6)
(7)
當(dāng)樣本數(shù)W足夠大時(shí),可以認(rèn)為Yj(n)服從高斯分布。N維能量向量表示為Y=(Y1,…,YN)T,具有多元高斯分布,所以具有以下平均向量和協(xié)方差矩陣:
μY|Hi=[μY1|Hi,…,μYN|Hi]T,i=0,1
(8)
(9)
(10)
對(duì)于向量Y,在H0和H1假設(shè)下,分別有
PHi=φ(Y|μY|Hi,∑Y|Hi)i=0,1
(11)
由于PU不活躍時(shí)PH0大于的PH1,PU活躍時(shí)PH0小于的PH1,因此可以使用二維向量
P=[PH0,PH1]T
(12)
代替Y=(Y1,…,YN)T進(jìn)行訓(xùn)練和判斷。由于此時(shí)P數(shù)值很小,對(duì)于區(qū)分PH0和PH1帶來不便不便,因此對(duì)其進(jìn)行變換,有
P[-SlnPH0,-SlnPH1]T
(13)
式中:參數(shù)S以及對(duì)數(shù)函數(shù)用于縮放。
在“無(wú)監(jiān)督學(xué)習(xí)”中,通過對(duì)無(wú)標(biāo)記的訓(xùn)練樣本的學(xué)習(xí)來獲取數(shù)據(jù)的內(nèi)在聯(lián)系及性質(zhì),為進(jìn)一步的數(shù)據(jù)分析奠定基礎(chǔ)。在這種學(xué)習(xí)中應(yīng)用最廣泛的就是“聚類”。K-Means聚類方法由于其實(shí)現(xiàn)算法簡(jiǎn)潔、聚類效果良好而被廣泛應(yīng)用。K-Means聚類方法雖然實(shí)現(xiàn)簡(jiǎn)潔,在二分類中效果優(yōu)良,但是由于其算法選擇分類中心的機(jī)制所限,會(huì)顯著受到異常數(shù)據(jù)的干擾,因此本文選擇了其改進(jìn)算法K-Meadiods,一定程度上降低噪聲和孤立樣本對(duì)于分類結(jié)果的干擾。
(14)
式中:|Hi|是簇Hi中元素的數(shù)量。將P分為兩類,則問題轉(zhuǎn)化為:
(15)
(16)
若fc(P)>λ,則認(rèn)為P屬于簇H0,否則屬于簇H1,其中λ為算法過程中產(chǎn)生的閾值。
支持向量機(jī)(Support Vector Machine,SVM)是一種建立在統(tǒng)計(jì)學(xué)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上的模式識(shí)別方法,在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì)。其核心思想是利用核函數(shù)將低維空間數(shù)據(jù)映射到高維空間,在高維空間中對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。模糊支持向量機(jī)[20](Fuzzy Support Vector Machine,FSVM)作為SVM的改進(jìn),引入了隸屬度函數(shù),反映了某個(gè)數(shù)據(jù)對(duì)超平面的影響程度,可以降低噪聲和孤立樣本等異常數(shù)據(jù)對(duì)分類效果的影響。
(17)
式中:slξl是FSVM中帶權(quán)重的松弛因子。式中C為常數(shù),整體的求解過程和標(biāo)準(zhǔn)的SVM相似,通過構(gòu)造拉格朗日函數(shù),得到上式的對(duì)偶規(guī)劃為:
yl≥0l=1,2,…,L
(18)
這是一個(gè)二次規(guī)劃(QP)問題。該問題可以進(jìn)一步優(yōu)化為:
(19)
按照算法二進(jìn)行運(yùn)算,可得到分類函數(shù)
(20)
式中:K(x,P(l))=φ(x)·φ(P(l))表示核函數(shù)。因此,對(duì)于測(cè)試概率向量Ptest有:
(21)
在本節(jié)中,對(duì)比了使用能量向量與概率向量在不同機(jī)器學(xué)習(xí)算法下的訓(xùn)練持續(xù)時(shí)間與分類延遲。分別考慮由一個(gè)PU和二個(gè)SU組成的CRN與由一個(gè)PU和16個(gè)SU組成的CRN。仿真參數(shù)設(shè)置如下:帶寬w=5 MHz,采樣頻率fs=10 MHz,感知持續(xù)時(shí)間τ=100 μs,根據(jù)路徑損失函數(shù)選擇信道系數(shù)α=4,1≤j≤N,νj和ψj均為1。PU發(fā)射功率為100 mW。
3.1.1 由1個(gè)PU和2個(gè)SU組成的CRN
在這一CRN中,PU與SU的分布如圖3所示。其中PU坐標(biāo)為(1,1)km,2個(gè)SU坐標(biāo)分別為(0.5,0.5)km、(2,2)km。在過去的諸多研究中,這種基本情況被廣泛用以形象化地解釋所提出的算法,本文同樣首先以此CRN作為基礎(chǔ)展開研究。
圖4 1個(gè)PU與2個(gè)SU分布
表1列出了在具有1個(gè)PU和2個(gè)SU的CRN中,兩種算法分別采用能量向量與概率向量的訓(xùn)練時(shí)間。可以看到,隨著訓(xùn)練樣本的增加,訓(xùn)練時(shí)間也合理地延長(zhǎng)。對(duì)于同一種算法,采用能量向量與概率向量在這一CRN中的訓(xùn)練時(shí)間非常接近,沒有明顯差別,因?yàn)槟芰肯蛄颗c概率向量都是二維向量。而對(duì)于不同算法,明顯可以看到采用FSVM的時(shí)間比K-Mediods大為減少,表明連續(xù)聚類比求解凸優(yōu)化問題耗費(fèi)更多時(shí)間。
表1 訓(xùn)練持續(xù)時(shí)間(N=2) 單位:ms
表2列出了兩種算法的分類延遲。根據(jù)式(16),K-Mediods分類時(shí)間主要取決于測(cè)試向量的維度,而不是樣本數(shù)量,且質(zhì)心的計(jì)算完成與訓(xùn)練階段,也不會(huì)占用分類時(shí)間,因此其分類延遲不受樣本數(shù)量的影響。顯然,對(duì)于能量向量與概率向量,K-Mediods的分類延遲相同。根據(jù)式(20),FSVM的分類延遲不僅受到被分類向量維數(shù)的影響,還會(huì)受到支持向量數(shù)量的影響,而隨著樣本數(shù)量的增加,支持向量數(shù)量也會(huì)增加,因此分類延遲也增加。而對(duì)于能量向量和概率向量,與K-Mediods 類似,分類延遲非常接近,并無(wú)明顯的差別。
表2 分類延遲(N=2) 單位:ms
圖5 檢測(cè)概率與SU個(gè)數(shù)/PU個(gè)數(shù)關(guān)系(虛警率Pf=0.1)
3.1.2 由1個(gè)PU和16個(gè)SU組成的CRN
由圖5可以發(fā)現(xiàn),當(dāng)只有1個(gè)PU時(shí),SU數(shù)量由9個(gè)增加到16個(gè)時(shí),檢測(cè)概率沒有發(fā)生相當(dāng)明顯的變化,因此本文考慮由1個(gè)PU和16個(gè)SU的CRN,布局如圖6所示,它們均位于2 km×2 km的正方形中。其中PU在(0.5,0.5)km處,SU均勻分布在正方形中,坐標(biāo)如圖6所示。
表3列出了在具有1個(gè)PU與16個(gè)SU的較大規(guī)模的CRN中,兩種算法分別采用能量向量與概率向量的訓(xùn)練時(shí)間。與表1相同,隨著訓(xùn)練樣本的增加,訓(xùn)練時(shí)間也合理地延長(zhǎng)。與表1不同的是,對(duì)于同一種算法,采用能量向量與概率向量的訓(xùn)練持續(xù)時(shí)間隨著樣本數(shù)量的增加幅度產(chǎn)生較大的差別。這是因?yàn)楦怕氏蛄渴?維向量,對(duì)于訓(xùn)練時(shí)間表現(xiàn)出穩(wěn)定性。當(dāng)然,在16維能量向量轉(zhuǎn)換為2維概率向量的過程中不可避免犧牲了一定的時(shí)間,因此對(duì)于同一種算法,采用概率向量比表1中的時(shí)間略有增加。但是這種增加遠(yuǎn)低于采用能量向量所導(dǎo)致的訓(xùn)練時(shí)間的巨額提升。
圖6 1個(gè)PU與16個(gè)SU分布
表4列出了兩種算法分別采用能量向量與概率向量的分類延遲?;谑?15),采用16維能量向量時(shí)K-Mediods的分類延遲比表2中增加了許多,但是沒有受到樣本數(shù)目增加的影響。采用概率向量的分類延遲與表2中非常接近。類似地,對(duì)于FSVM,采用概率向量比采用能量向量有更低的分類延遲。
表4 分類延遲(N=16) 單位:ms
圖7 基于能量向量的K-Mediods分類
仿真結(jié)果如圖7~圖12所示。
圖11 不同算法基于能量向量和概率向量的ROC曲線(16SU,-12 dB)
圖8 基于概率向量的K-Mediods分類
圖9 基于能量向量的FSVM分類
圖10 基于概率向量的FSVM分類
圖12 不同算法基于能量向量和概率向量的ROC曲線(16SU,-8 dB)
圖7~圖10分別展示了在圖4分布下觀測(cè)到的能量值和相應(yīng)的概率向量及分類。圖7采用K-Mediods 聚類方法對(duì)能量向量進(jìn)行了分類,分類中心如圖中黑色X標(biāo)記所示。水平坐標(biāo)軸與豎直坐標(biāo)軸分別代表一個(gè)SU感知得到的能量數(shù)值。明顯看到,對(duì)于兩條坐標(biāo)軸數(shù)值都偏低的節(jié)點(diǎn),分類器將其判斷為H0,意味著這些節(jié)點(diǎn)中不存在PU用戶;相反,對(duì)于兩條坐標(biāo)軸數(shù)值都偏高的節(jié)點(diǎn),分類器將其判斷為H1,這也符合我們的預(yù)期,即信道中存在PU信號(hào)時(shí)能量普遍大于只存在噪聲的情況。圖8,將概率向量應(yīng)用于K-Mediods聚類,可以看到其數(shù)據(jù)形成了弧形,且在弧頂聚集了大量數(shù)據(jù)。同樣地,黑色X標(biāo)記代表了分類中心。此外,圖7與圖8的坐標(biāo)數(shù)值也有著巨大的差異,這是由于在能量向量變換為概率向量的過程中進(jìn)行了復(fù)雜的數(shù)學(xué)運(yùn)算。雖然數(shù)值有了較大的改變,但是兩圖中數(shù)據(jù)對(duì)應(yīng)的意義仍然一致。圖9 與圖10分別表示使采用能量向量與概率向量的FSVM算法。與圖7不同,圖9中分類的依據(jù)不是某一個(gè)中心點(diǎn),而是由數(shù)量龐大的綠色支持向量作為分類的依據(jù),其帶來的影響之一就是分類精度的提高,但也會(huì)導(dǎo)致分類延遲隨著樣本數(shù)量的增加而增加,表2 和表4的數(shù)據(jù)都支持這一判斷。對(duì)于圖6中的場(chǎng)景分布,無(wú)法直觀地畫出能量向量的分布圖,因此為了更好地對(duì)比兩種算法,采用ROC曲線來比較兩算法的性能。圖11表示由1個(gè)PU與16個(gè)SU組成的CRN在-12 dB時(shí)的ROC曲線。顯然,對(duì)于同一種算法,兩種向量所對(duì)應(yīng)的曲線性能極為接近,在虛警率較低時(shí),采用概率向量所對(duì)應(yīng)的檢測(cè)概率比采用能量向量所對(duì)應(yīng)的檢測(cè)概率略低一些,而隨著虛警率提升,兩類曲線逐漸趨于吻合,ROC曲線的非常接近。圖12表示由1個(gè)PU與16個(gè)SU組成的CRN在-8 dB時(shí)的ROC曲線。通過觀察可以發(fā)現(xiàn),對(duì)于FSVM算法,采用能量向量與概率向量的兩條ROC曲線吻合度非常高,在虛警率小于0.2的范圍內(nèi),兩條曲線近似重合;對(duì)于K-Mediods算法,在虛警率小于0.2時(shí)采用能量向量時(shí)的檢測(cè)概率比采用概率向量時(shí)的檢測(cè)概率略高一些,但是當(dāng)虛警率提升到0.2后,后者的檢測(cè)概率反而比前者更高一些,顯然,在這一情況下ROC曲線的性能有了略微的提高。
本文提出的二維概率向量,適用于在SU較多的CRN中進(jìn)行協(xié)作頻譜感知,通過能量檢測(cè)獲取各個(gè)SU采集到的能量值,組成高維向量,對(duì)此向量進(jìn)行數(shù)據(jù)處理,有效降低了數(shù)據(jù)維數(shù)。并且在采用機(jī)器學(xué)習(xí)算法進(jìn)行驗(yàn)證后,發(fā)現(xiàn)其比能量向量在訓(xùn)練時(shí)間、分類延遲中都具有更加優(yōu)良的性能表現(xiàn),而通過ROC曲線可以發(fā)現(xiàn)其性能損失很小,甚至在某些情況下會(huì)展現(xiàn)出更好的性能表現(xiàn)。