趙 浩, 梁 懿, 王玉達(dá)
(上海無線電設(shè)備研究所,上海200090)
機(jī)會頻譜接入(OSA,Opportunistic Spectrum Access)最早由美國國防部高級研究計劃署(DARPA,Defense Advanced Research Projects Agency)提出,旨在通過動態(tài)重新分配已有的頻譜資源,改善現(xiàn)有軍事通信在全球范圍內(nèi)部署的性能。OSA 可借助認(rèn)知無線電(CR,Cognitive Radio)技術(shù)予以實現(xiàn)[1]。通過將系統(tǒng)分為主用戶和從用戶兩個子系統(tǒng),在不影響主用戶正常通信的前提下,具備頻譜感知能力的從用戶可主動地檢測頻譜使用情況,并根據(jù)檢測結(jié)果,自適應(yīng)地接入空閑信道進(jìn)行通信。
OSA 適用于某地區(qū)頻譜資源缺乏時,無線傳感器網(wǎng)絡(luò)或其它具有安全應(yīng)急功能網(wǎng)絡(luò)的方便快速部署[2]。在該類網(wǎng)絡(luò)中,傳感器節(jié)點通常能量有限,靠其攜帶的電池維持工作,所以對能量有效性的要求較高。本文研究了傳感器節(jié)點組成分布式從網(wǎng)絡(luò),從網(wǎng)絡(luò)中各節(jié)點存在能量約束時,基于部分可觀察馬爾可夫決策過程(POMDP,Partially Observable Markov Decision Process)模型設(shè)計的機(jī)會頻譜接入方法[3],通過為檢測和接入算法設(shè)置兩固定門限,控制從用戶接入網(wǎng)絡(luò),從而提高接入的能量效率。
考慮被劃分為N 個頻域信道的一段頻譜,每個信道的帶寬為Bn(n=1,…,N)。主網(wǎng)絡(luò)工作于該段頻譜上,采用同步分時隙結(jié)構(gòu)進(jìn)行通信。在時隙t內(nèi)主網(wǎng)絡(luò)對信道n 的占用情況可用Sn(t)表示(其中Sn(t)∈{0(占用),1(空閑)}),則整段頻譜的信道占用狀態(tài)可由矢量S(t)表示。S(t)?[S1(t),…,SN(t)]形成一個狀態(tài)空間為?={0,1}N的馬爾可夫鏈,馬氏轉(zhuǎn)移概率為
從網(wǎng)絡(luò)以Ad Hoc式疊加于主網(wǎng)絡(luò)之上,每個從用戶獨立地在全部N 個信道中選擇時域頻譜機(jī)會進(jìn)行檢測并接入??紤]硬件設(shè)計和能量限制,設(shè)每個從用戶每時隙內(nèi)只能選擇一個信道進(jìn)行檢測。
在時隙起始位置,從用戶先決定工作模式:“休眠”或“檢測”。若“休眠”,從用戶將在本時隙內(nèi)關(guān)閉收發(fā)機(jī),直到下一個時隙再打開;若“檢測”,從用戶將選中一個信道進(jìn)行檢測,并根據(jù)檢測結(jié)果決定是否接入該信道。
信道模型采用塊狀信道衰落模型(Block Channel Fading Model),其特點是,在不同傳輸時隙上的信道增益為獨立同分布隨機(jī)變量。
能量模型方面,假設(shè)從用戶電池初始能量為e0,每時隙內(nèi)能量消耗為:
a)休眠狀態(tài)消耗的能量ep;
b)頻譜檢測狀態(tài)消耗的能量es;
c)在信道n上傳輸信息消耗的能量Etx(n)。
一般情況下,有ep?es<Etx(n)。傳輸消耗的能量Etx(n),根據(jù)當(dāng)前的信道增益,呈現(xiàn)一隨機(jī)變量形式。信道增益越大,傳輸信息需要的功率越低;信道增益越小,傳輸信息需要的功率越高。設(shè)以第k個電平傳輸信息時,電池所消耗的能量為εk,且ε1<…<εL(L 為總電平數(shù))。隨機(jī)變量Etx(n)的概率質(zhì)量函數(shù)pn(k)由信道增益狀態(tài)決定,表示為
機(jī)會頻譜接入的設(shè)計需考慮選擇哪個信道執(zhí)行檢測(信道選擇策略πs)和是否接入該檢測信道(接入策略πc)。
能量限制模型下的機(jī)會頻譜接入設(shè)計,可表示為求解一個POMDP 問題[4],但需將從用戶剩余能量E(t)作為一個重要的參數(shù)引入設(shè)計過程。
在任一時隙t起始位置,從用戶根據(jù)信道占用狀態(tài)S(t)和剩余能量E(t),決定本時隙的工作模式:休眠或檢測。以選中信道0(即a(t)=0,但實際中信道0并不存在)代表進(jìn)入休眠模式;以選中全部N 個信道之一(即a(t)∈{1,…,N})代表進(jìn)入檢測模式,則時隙t內(nèi)信道選擇策略πs可表示為
對信道執(zhí)行檢測時,檢測結(jié)果包含兩個方面,一為信道是否可用(以Θa(t)=0代表信道a 不可用,以Θa(t)>0代表信道a 可用),二為可用時信道增益值(以Θa(t)∈{1,…,L}代表L 種可能的信道增益)。檢測結(jié)果Θa(t)可表示如下:
對應(yīng)L 種信道增益,從用戶以第k 個能量電平進(jìn)行傳輸,如式(2)所示。
根據(jù)信道a 處的檢測結(jié)果Θa(t),接入策略πc,需決定是否對信道a進(jìn)行接入。用Φk(t)代表檢測結(jié)果為Θa(t)=k時的接入判決結(jié)果:
在下述兩種情況下,從用戶不對信道進(jìn)行接入(Φk(t)=0):
a)為避免與主網(wǎng)絡(luò)發(fā)生碰撞,當(dāng)信道檢測結(jié)果為不可用時(Θ(t)=0),將不對信道進(jìn)行接入;
b)當(dāng)剩余能量不足以使從用戶在本時隙信道衰落場景下完成接入時,也將不對信道進(jìn)行接入。
而在a)和b)之外的情況下,從用戶對信道進(jìn)行接入(Φk(t)=1)。
在時隙t的尾部,從用戶將根據(jù)先前的判決和檢測結(jié)果,對信道占用狀態(tài)統(tǒng)計特性進(jìn)行更新;同時也對剩余能量進(jìn)行更新,即從E(t)=e更新為
本節(jié)通過對信道選擇策略πs和接入策略πc設(shè)置兩個固定門限,以提高能量約束下從用戶的接入效能。
信道選擇策略πs采用時隙最優(yōu)策略,即選擇時隙t內(nèi)空閑可能性最大的信道a(t)進(jìn)行檢測:
進(jìn)而設(shè)置一個固定的信道可用概率門限r(nóng)th(rth∈(0,1)),當(dāng)上述信道選擇策略選中信道的可用概率大于等于rth時,從用戶才啟動檢測過程。否則,從用戶將轉(zhuǎn)入休眠狀態(tài)以節(jié)約能量。表述如下:
固定信道可用概率門限r(nóng)th的設(shè)定,根據(jù)文獻(xiàn)[5]中給出的最優(yōu)解的范圍特性,可進(jìn)一步縮小至rth∈[min{p0,1,p1,1},p0,1/(1+p0,1-p1,1)],通過逐點驗證確定門限r(nóng)th,其中{p0,1,p1,1}為主網(wǎng)絡(luò)信道占用狀態(tài)馬氏轉(zhuǎn)移概率。
接入策略πc,以接入所需傳輸電平Etx作為設(shè)計依據(jù),通過設(shè)置一個固定的從用戶傳輸電平門限kth,當(dāng)本時隙從用戶接入所需傳輸電平小于kth時,進(jìn)行接入;否則,不進(jìn)行接入以節(jié)約能量,可表述為
這里固定門限kth∈{1,…,L}為一個離散集合,kth也通過逐點驗證求得。
對能量約束模型下兩固定門限的機(jī)會頻譜接入算法進(jìn)行仿真。設(shè)信道為單位帶寬B=1,主網(wǎng)絡(luò)信道占用狀態(tài)馬氏轉(zhuǎn)移概率為{p0,1=0.2,p1,1=0.8}。從用戶休眠狀態(tài)消耗能量ep=0.1(設(shè)能量單位為“1”),執(zhí)行頻譜檢測消耗能量es=0.3;根據(jù)信道增益統(tǒng)計特性,從用戶對應(yīng)的傳輸電平Etx共有四個(Etx∈{1,2,3,4}),每種傳輸電平{1,2,3,4}出現(xiàn)的概率質(zhì)量函數(shù)為[p(1),p(2),p(3),p(4)]=[0.2,0.3,0.3,0.2];從用戶初始能量為e0=40。
在信道選擇策略πs和接入策略πc的設(shè)計中,固定信道可用概率門限r(nóng)th和接入門限kth分別設(shè)定:rth∈(0,1),kth∈{1,2,3,4},其中rth步長取0.05。從起始時刻開始,直至從用戶能量耗盡為止,從用戶的總收益示意圖如圖1所示。
圖1 兩固定門限接入算法收益示意圖
在仿真中,從用戶收益的最大值在rth=0.27,kth=2 處取得,在該兩門限值處對圖1 的立體圖做切割,得到相應(yīng)的剖面圖如圖2、圖3所示。圖中可以看出從用戶總收益隨門限值rth,kth變化,符合前述分析結(jié)果。
圖2 兩固定門限接入算法最優(yōu)收益剖面圖(門限r(nóng)th)
在從用戶初始能量相同(e0=40)的前提下,圖4對從用戶未設(shè)門限(rth=0,kth=4)與采用兩固定門限(rth=0.27,kth=2)的兩種情況獲得的總收益進(jìn)行了比較。由圖中可看出,兩固定門限算法與未設(shè)門限算法相比,在從用戶工作全程(從用戶能量從e0消耗至0的過程)內(nèi),可以更有效提升接入總收益。
本文提出為信道可用概率和信息傳輸電平設(shè)置固定門限的方法,對能量約束下的信道選擇策略和接入策略進(jìn)行改進(jìn),以節(jié)約能量為目標(biāo),提升系統(tǒng)接入收益。仿真結(jié)果顯示,與未設(shè)門限的算法相比,兩固定門限算法可提升系統(tǒng)收益,且固定門限方式可簡化系統(tǒng)復(fù)雜度。
[1] Mitola J,Maguire G Q.Cognitive Radio:Making Software Radios More Personal[J].IEEE Pers Commun,1999,6(4):13-18.
[2] Marshall P F.Extending the Reach of Cognitive Radio[J].Proceedings of the IEEE,2009,97:612-625.
[3] Zhao Q,Tong L,Swami A,et al.Decentralized Cognitive MAC for Opportunistic Spectrum Access in Ad Hoc Networks:A POMDP Framework[J].IEEE J Sel Areas Commun,2007,25(3):589-600.
[4] Chen Y,Zhao Q,Swami A.Distributed Spectrum Sensing and Access in Cognitive Radio Networks with Energy Constraint[J].IEEE Trans Signal Processing,2009,57(2):783-797.