趙振濤,尹斯星,李書芳
(1.公安部第一研究所;2.北京郵電大學)
由于頻譜資源的有限性,無線通信系統(tǒng)中射頻前端的參數設置需根據頻譜使用情況和相關頻譜管理規(guī)定進行設定。認知無線電(Cognitive Radio,CR)技術可以感知周圍無線頻譜環(huán)境。按照現(xiàn)有頻譜分配原則,無線頻譜資源劃分為授權頻段與非授權頻段,得到授權的團體和個人長期獨占該頻譜使用權。由于在某個地點授權用戶(又叫主用戶,Primary Users,PUs)不會在任何時間都使用該頻段,因此,不少授權頻段都處于空閑的狀態(tài)(稱為頻譜空洞或頻譜孔)。如3G/4G/5G和廣播電視的授權頻段雖然保障了高通信質量,但大多數時間的信道利用效率卻太低(我國大多數城市的大多數時間飽和度不到35%)。因此需要利用認知無線電的頻譜感知等關鍵技術,對無線信道進行能量收集和實時監(jiān)測,在保障業(yè)務服務質量的基礎上改變頻譜的子信道分配和功率的效能分配,讓非授權用戶(又叫次級用戶,Secondary Users,SUs)以競爭方式接入使用,從而更加有效地調控電磁環(huán)境中的頻譜效率[1]。
對于需要無線充電的無線傳感器,首先需要外部充電過程為感知計算和數據傳輸提供能量。如果沒有足夠的能量,傳輸也會中斷。能量收集的主要挑戰(zhàn)不是最小化能量消耗和最大化網絡運行時間,而是收集能量的效用最大化[2],即通過利用環(huán)境能量的空間變化來最大化數據傳遞速率[3]。能量效率間接反映了傳感器對頻譜的利用效率。為了改善CR系統(tǒng)的能量效率,通常采用降低能量消耗以及能量收集的方法[4]。其中,能量收集以能量補充的方式來確保系統(tǒng)的供能,在無線網絡中具有十分廣泛的應用,如移動Adhoc 網絡、蜂窩網絡、傳感器網絡和車載網絡等場景。在能量收集的相關研究中,文獻[5?7]從信息論的角度出發(fā),在不同的CR 系統(tǒng)中研究了基于能量收集的信道容量邊界。文獻[8,9]則研究了不同條件下能量收集的最優(yōu)策略與規(guī)則,其中,文獻[8]研究了單用戶能量收集無線通信系統(tǒng)中的最佳分組調度問題,根據流量負載和可用能量自適應地調整傳輸速率,從而獲得分組與傳輸所需的最小時間。文獻[9]則是基于能量采集時間和可充電電池容量均受限的情況,設計的最優(yōu)傳輸策略。由于從環(huán)境中獲取的射頻能量對傳感器的充電量不確定,為探尋最佳能源管理政策,在能量傳輸和通信功能之間進行權衡[10],就需要對預期的無線網絡信號時間進行最優(yōu)設計。F.Ian‐nello 和O.Simeone[11?13]基于Markov 模型重新設計了媒體訪問控制(MAC)協(xié)議,構造了傳感器最優(yōu)的能量傳遞和最優(yōu)的數據通信時間的函數表達式[14]。Mi‐chelusi則提出了基于在線優(yōu)化的能量管理方案[15]。
很明顯,次用戶能量收集時間越長,可以獲得更多的能量,使得瞬時傳輸速率得以改善[16];為提高次用戶的傳輸性能,需要感知更多信道能夠獲得更多的可用信道,這會以消耗更多時間和能源為代價[17]。在時隙模式中,用在能量收集和信道感知上的時間越多,數據傳輸的時間越少,SUs的有效傳輸質量(傳輸數據總量和鏈路頻譜效率)就越低[18]。文獻[19]設計的次用戶的頻譜感知策略、分配的感知時間、能量,獲得主次用戶數據通信總吞吐量的最大值。而文獻[20]是在保證主用戶通信不受影響的前提下,優(yōu)化的頻譜感知策略以獲得最大的次用戶數據通信的最大吞吐量。
上述的工作主要從頻譜感知、接入策略以及網絡性能等方面進行了研究。實際情況下,非授權用戶運行的時隙中能量收集和頻譜感知會產生相互影響和制約,目前很少有工作對能量收集與頻譜感知進行協(xié)同管理,來對整體性能進一步優(yōu)化[21]。為此,本文將重點放在能量收集和頻譜感知的策略設計上,以進一步優(yōu)化SUs的期望鏈路頻譜效率。本文設計的CR 系統(tǒng)基于能量收集和頻譜共享的感知優(yōu)化,其中SUs 以時隙模式運行。假設時隙被分為三個非重疊部分,分別用于能量收集、頻譜感知和數據傳輸。由于這三個操作共享操作時隙和能量消耗,因此三者之間存在著博弈平衡:能量收集時間越長,可以獲得更多的能量,使得瞬時傳輸速率得以改善;雖然會消耗更多時間和能源代價,不過通過感知更多信道能夠獲得更多的可用信道。然而,在時隙模式中,花費在能量收集和信道感知上的時間越多,數據傳輸的時間越少,這就降低了SU 的有效傳輸質量(即,可實現(xiàn)的吞吐量)。為此,我們將重點放在能量收集和頻譜感知的策略設計上,以進一步優(yōu)化SU 的期望有效吞吐量。同樣,根據感知結果靈活調整電磁調控器件的參數,有利于提高頻譜感知的數據精度。
CR系統(tǒng)中對頻譜的利用可分為交織、覆蓋和分層三種不同模型。在交織模型中,非授權用戶只能通過頻譜感知技術發(fā)現(xiàn)其他非授權的空閑頻譜并加以利用,而不允許使用授權用戶的頻帶。在覆蓋模型中,非授權用戶與授權用戶以合作共享。非授權用戶要將自己的能量分成兩部分,其中一部分用于提高授權用戶功率,提高授權用戶的增益、以減輕非授權用戶傳輸引起的干擾,這樣才能換來授權用戶頻譜的使用權,用于非授權用戶自身的數據。
在分層模型中,允許授權用戶和非授權用戶共存,因此網絡也被稱為頻譜共享網絡[22],且授權用戶比非授權用戶在頻譜分配上具有更高的優(yōu)先級,非授權用戶必須在授權用戶預定義的干擾約束(即預定義的干擾閾值)下才能共享。本文基于分層模型進行對需要無線供電的無源SUs傳感器(對于有源SUs,可認為其能量收集的時隙為零)進行頻譜感知的優(yōu)化和實驗驗證。
設定可利用的頻譜總時長一定,SU 采集、消耗能量三個過程——能量采集、頻譜感知、數據傳遞均以時隙的長短來衡量。這三個操作共享整個時隙和能量消耗,顯然三者之間存在相互制約的折中關系:能量采集的越多,傳輸速率越高;感知更多的可用信道,就意味著占用更多的時間和能量;而能量采集和頻譜感知又擠占真正用來數據通信的時間,從而降低SU總的有效通信能力(吞吐量)。
考慮到能量收集的能量雙工約束的“save?then?transmit”協(xié)議[23]和頻譜感知的實際硬件限制中的“l(fā)isten?before?talk”協(xié)議[10],設定次級用戶采用“能量采集‐頻譜感知‐數據傳輸(Harvesting?Sens‐ing?Transmitting,H?S?T)”結構,SUs 每一次感知一個信道,判斷其可用性并計算覺得是否繼續(xù)感知新的信道[10]。如圖1 所示,感知共享過程以三個非重疊的時隙模式運行,時隙分別用于能量收集,頻譜感知和數據傳輸。這里只關注SUs 的期望鏈路頻譜效率而不是瞬時鏈路頻譜效率,因此設定SUs 的能量采集均值保持不變。本文主要符號見表1。
圖1 能量采集?頻譜感知?數據傳輸的時隙結構圖
表1 頻譜共享優(yōu)化模型中主要符號縮寫
H?S?T頻譜共享結構的三個階段為:
(1)能量采集:在(0,ρT]時間段,SUs 從電磁環(huán)境中收集并儲備能量;
(2)頻譜感知:在(ρT,ρT+nTs]時間段,停止能量采集,開始對各信道進行感知與計算(圖1 中,其中前3個信道可用,最后1個不可用)。
(3)數據傳輸:在(ρT+nTs,T]時間段,停止感知計算,啟用存儲設備中的能量進行數據傳輸。
H?S?T 策略采用時間順序逐個感知信道,SU 先感知一個授權信道,判斷其是否可用,然后判斷是否停止感知僅使用當前獲得的信道進行數據傳輸,還是根據剩余的時間和能量是否仍有機會進一步改善總的信道能力而繼續(xù)感知新的信道。如果感知一個或多個信道(即使獲得了更多的可用信道)也無法改善由于頻譜感知產生的時間和能量代價,即無法提高鏈路頻譜效率,則終止感知工作。圖1 中表達了SU 在感知四個授權信道之后決定終止頻譜感知,并利用三個可用信道進行數據傳輸。
基于以上H?S?T 策略,給定每次感知共享過程的能量采集的時隙占比ρ,SUs 逐個感知授權信道并基于先前的感知結果決定是否終止。于是,SU 的頻譜感知決策問題即可轉化為個別參數確定條件下整體優(yōu)化的最佳終止問題(Parametrized Optimal Stopping Problem,POSP)。如圖2 所示,SU 的頻譜感知規(guī)則可以通過二叉樹直觀地表示。
圖2中每個節(jié)點的左分支子節(jié)點表示獲得可用信道(概率為P),右分支表示不可獲得信道(概率為1?P)。紅色表示終止繼續(xù)感知。節(jié)點上的數字表示在每次感知之后可用信道的總數量,每條路徑的深度表示已感知的信道數量。在每個感知步驟中獲得可用信道的概率用數學語言表達為P=p(1?Pf)。頻譜感知規(guī)則如同圖2的樹形結構,從根節(jié)點開始,基于每個感知步驟處的感知結果沿著相應路徑前進。如果檢測到可用信道,則將左子節(jié)點作為下一節(jié)點(leaf nodes),如果沒有檢測到可用信道,則取右側,最終在不能進一步增強SU 的鏈路頻譜效率的紅色節(jié)點結束,而初始狀態(tài)表示沒有進行感知且未獲得可用信道。因此,規(guī)則樹中的每一條路徑對應于的頻譜感知所有過程S 中的一種可能情況(感知觀測序列)。例如,圖1 中所示的頻譜感知過程對應于圖2 中左起第二路徑。
圖2 基于二叉樹的頻譜感知規(guī)則可視化
可以得到,SU 在當前時隙中可獲得的數據吞吐量期望值與頻譜感知遵循規(guī)則樹的路徑t的相關函數為:
由于SU 的頻譜感知過程(即,頻譜感知規(guī)則樹中不止一條可能的路徑)Dt、At存在于多種可能情況,所以R(ρ,U)顯然是隨機值。因為信道噪聲增益r在一個時隙內保持不變,可被視為能量收集環(huán)節(jié)中的固定損耗,令“r=1”,X就代表了接收端的等效能量采集功率。將α定義為頻譜感知一個信道的歸一化時間,β定義為歸一化能耗,SU 基于離散路徑的數據總吞吐量的期望值就可表示為:
其中0<α=Ts/T<1,0<β=Es/XT<1。注意,在規(guī)則U中的每個感知步驟均受限于時間和能量,即,僅當剩余時間和能量足夠時,感知一個或多個信道的規(guī)則才是可行有效的。
由于在頻譜共享過程中,公式(1)中能量采集的時隙占比ρ 也是要優(yōu)化的變量,而每個時隙占比ρ唯一地確定了一種最佳的頻譜感知規(guī)則U=U(ρ),所以求解公式(2)的POSP問題就更具挑戰(zhàn)性,其可以分解為感知策略和算法優(yōu)化兩個子問題:I)給定ρ 的條件下尋求最優(yōu)頻譜感知規(guī)則;II)基于子問題I的解,通過優(yōu)化ρ來求解公式(2)。
如前所述,總時長T一定的條件下,一旦能量采集時隙占比ρ確定,頻譜感知的最優(yōu)策略即可轉述為一種有限時間段的POSP問題。其目的尋找這樣的最佳頻譜感知規(guī)則:SUs 在當前感知到的可用的信道(定義為“已觀測信道”)能夠實現(xiàn)的最大的期望信道數據吞吐量(定義為“信道回饋”)。
開始按規(guī)則樹感知找到的具有最大的。頻譜感知規(guī)則由兩個要素決定:
(1)已觀測信道狀態(tài)的序列,由Z1,Z2,...表示,它們服從伯努利分布,且與概率P互不相關;
(2)一系列信道回饋函數給定當前觀測到的可用信道,即由R0,R1(z1),R2(z1,z2),......,R∞(z1,z2,...)表示的SU數據吞吐量的期望值。這里zi∈{0,1}(i∈{1,2,...}),i為序號,zi=0 表示信道空閑可用,zi=1 表示信道繁忙已被占用。信道回饋Rn(z1,...,zn)可以表示為:
其中,an=表示在已觀測信道z1,...,zn中獲得的可用信道。此時,頻譜感知規(guī)則優(yōu)化問題就可描述為:在感知到n個信道并觀測Z1=z1,Z2=z2,...,Zn=zn之后,SU 決定是終止感知并獲得已知的信道回饋Rn(z1,...,zn),還是繼續(xù)感知下一個信道并觀測Zn+1。特別地,如果沒有感知信道(i=0)并且也不再進行信道觀測,則接收常數R0=0;由于事實上頻譜感知規(guī)則是有界的,如公式(3)所示,永不終止的頻譜感知是不存在的,可被感知的信道數量的上限Nu=取決于時間和能量約束以及CR 系統(tǒng)中的有限信道數。通過反向歸納來分析,由于SU必須在Nu終止感知(在感知Nu信道之后),就要求先在Nu?1時就找到最佳頻譜感知規(guī)則。已知Nu?1時的頻譜感知規(guī)則,回推階段Nu?2,以此類推,直到回到起始原點。
既然最初即知感知數量最多是Nu,則從最初階段i=0 到i=Nu共Nu個信道全部期望的數據總吞吐量就為:
由Nu直到遞推到初始階段0,0 由于各信道相互獨立,且服從相同的伯努利分布,因此得到 通過遞歸求解公式(5)在給定ρ條件下的最優(yōu)化后的頻譜感知規(guī)則U*(ρ),依據圖2 感知規(guī)則,SU 的期望數據吞吐量表示為 其中S*(ρ)是在優(yōu)化后的感知規(guī)則U*(ρ)中,從的根節(jié)點到子葉節(jié)點的路徑集合,而是指U*(ρ)中路徑t 的路徑深度和最優(yōu)可用信道數量。 在給定ρ條件下確定了最佳頻譜感知規(guī)則U*(ρ)之后,再將最佳感知規(guī)則U*(ρ)帶入等式(2)對ρ 進行優(yōu)化,將獲得的ρ和U*(ρ)代入等式(7): 將公式(7)中(ρ,U*(ρ))進行描點繪圖,得到的曲線通常不是凸函數[24],因此公式(8)中的最大值不能直接用凸函數的求最大值方法。(ρ,U*(ρ))的曲線主要有圖3 中的四種,其中只有圖3(a)中的(ρ,U*(ρ))曲線為整體凸形,說明很小的時間代價與能量代價(0<α<0.01,0<β<0.01)即可滿足一次頻譜感知時,信道數據吞吐量的期望值對于能量采集時間比這個變量的函數是凸的。隨著頻譜感知的時間代價α與能量代價β 的增加,盡管不能確定信道數據吞吐量的期望值(ρ,U*(ρ))是否為凸形,但可以將其視為分段的凸形曲線,如圖3(b) (c) (d)所示,每個段凸形曲線就是一個規(guī)則不變區(qū)間,規(guī)則不變區(qū)間就是每個保證凸函數的能量采集時間比的范圍。對比每個規(guī)則不變區(qū)間的最優(yōu)值,即可獲得全局的最優(yōu)值。如圖3 (c)中的全局最優(yōu)期望有效吞吐量及存在于0.36<ρ<0.41 的區(qū)間內。過?。?<ρ<0.1)或過大(0.9<ρ<1)的能量采集時隙都會由于過于有限的采集能量或傳輸時間使得期望有效吞吐量接近于零,不可能為最優(yōu)也就無需詳細討論,所以,圖3 僅展示了能量采集時隙占從0.1 到0.9 的情況。 圖3 不同時間和能量成本的Rˉ(ρ,U*(ρ))曲線 (ρ,U*(ρ))的分段凸形源于在ρ的一定區(qū)間內U*(ρ)保持不變,而S*(ρ),三者與相關也為U*(ρ)常數,卻與ρ不直接相關,這些ρ的區(qū)間也因此稱為“規(guī)則不變區(qū)間”。在規(guī)則不變區(qū)間中,得到期望鏈路頻譜效率為: 因為系數為正的對數函數為單調遞增凸函數,且分段變化的概率函數為正值,因此等式(9)在其遞增范圍內是凸形曲線。 所以,U*(ρ)是分段變化的,(ρ,U*(ρ))是分段凸形的。特別地,如圖3 (a),如果每次頻譜感知時間足夠短、能耗足夠低,這就表示能夠感知所有N個授權信道,剩余的時間和能量可全部用于數據傳輸,則U*(ρ)始終保持不變,因此對于任何ρ,(ρ,U*(ρ))是嚴格凸的。圖3(c)中的一些規(guī)則不變區(qū)間數據傳輸速率卻極低,這是因為根據最佳頻譜感知規(guī)則,為了感知盡量多的信道,使得留給SU 用于數據傳輸的能量或時間很少[22]。 因此,本文提出了分段局部最優(yōu)比較算法(Piece‐wise Local Optimium Comparision,PLOC)來尋找全局最優(yōu)。該PLOC 算法用二分法枚舉所有規(guī)則不變的區(qū)間,先精確定位每個規(guī)則不變區(qū)間的起始點和終點,遍歷求得每個區(qū)間的局部最優(yōu)值,由于(ρ,U*(ρ))是凸形的,通過求導可以得出每個區(qū)間中的局部最優(yōu)值。然后通過比較所有局部最優(yōu)值來選擇最佳值來確定全局最優(yōu)值,再返回來確定全局最優(yōu)能量采集時隙占比ρ。 為評估該PLOC 算法的復雜度,本文通過一個具有10個授權信道的CR 系統(tǒng),并選擇解決凸形問題的典型算法——模擬退火算法(Simulated Anneal‐ing Algorithm,SAA)作為算法優(yōu)化的參照。模擬退火算法來源于固體退火降溫原理,最早的思想是由N.Metropolis 等人于1953年提出[25]。在熱力學中,物體的溫度愈低,其分子熱能愈少。物體緩慢的降溫過程叫退火,直到其內能最低的結晶狀態(tài)。將處于非晶體狀態(tài)的固體加至充分高溫,再進行退火,直至晶體狀態(tài),系統(tǒng)達到最穩(wěn)定狀態(tài),這樣就找到了分子穩(wěn)定的“最優(yōu)解”。設E為物體在溫度T時的分子內能,ΔE為溫度T時物體的內能改變量,k為玻爾茲曼常數,則根據Metropolis 準則,物體在溫度為T時,出現(xiàn)減小ΔE的內能時以趨于降溫平衡的概率為exp(-ΔE/(kT))[26]。如果這個高溫至晶體的過程存在全局的最優(yōu)解,則尋求的分子穩(wěn)定即為分子的最穩(wěn)定的解。1983年,S.Kirkpatrick 等人基于Monte?Carlo 迭代求解策略成功地將固體退火思想引入到組合優(yōu)化領域形成了具有時變概率的全局優(yōu)化的串行結構優(yōu)化算法SAA[26]。SAA 從某一高溫狀態(tài)開始退火,尋求最優(yōu)解,但此時最優(yōu)解有可能是局部最優(yōu)解,因此SAA 算法通過概率性地跳出局部區(qū)間,并最終遍歷全局,尋找到全局最優(yōu)解[27]。借用固體退火思想,將物體內能E模擬為目標函數值f,物體溫度T演化成控制參數t,由初始解和控制參數t開始,依概率在不同區(qū)間進行跳轉,對當前解重復優(yōu)化迭代,算法終止時即逼近全局最優(yōu)解[26]。 通過運行在HP Z210 工作站上的MATLAB 2010a進行50次仿真測試,無論效率如何,兩種算法都能確保它們收斂到全局最優(yōu)性。兩種算法的平均運行時間如圖4 所示,PLOC 算法比SAA 算法快很多。這是因為SAA 算法只是一味地搜索全局最優(yōu),而PLOC 算法利用Rˉ(ρ,U*(ρ))的分段凸形將原始問題分解為有限數量的分段凸形子問題,這些子問題可以通過連續(xù)求導而快速收斂。此外,頻譜感知的時間和能量代價ρ越高,頻譜感知規(guī)則樹的深度越小,兩種算法遍歷整個規(guī)則樹的速度越快。 圖4 PLOC和SAA的復雜性比較(秒級) 基于搜索的PLOC 算法雖然可推導出全局最優(yōu)能量采集時隙占比和頻譜感知規(guī)則,然而,由于計算相對復雜,特別是在頻譜感知的短時間和低能耗的情況下,將大大擴展頻譜感知規(guī)則樹,并會在該問題在付出較高的計算代價。為了進一步降低復雜性,通過將原始動態(tài)問題近似為靜態(tài)問題,本文提出了一種可以一次性求的次優(yōu)解決方案,從而避開基于搜索原理的PLOC算法。 如前所述,SU 的頻譜感知規(guī)則可以通過二叉樹直觀地表示。為統(tǒng)一數學建模,將路徑深度Dt為隨機數的二進制規(guī)則樹替換為各路徑皆完整的二進制規(guī)則樹:對頻譜感知規(guī)則施加額外約束,規(guī)定規(guī)則樹是完整二進制規(guī)則樹,其中每個路徑具有一致的深度。于是,由SU 感知固定數量的信道,從中選擇可用的信道用于數據傳輸,因此頻譜感知規(guī)則就簡化為如何確定最優(yōu)的感知信道數量。因此,公式(2)變?yōu)殪o態(tài)問題,其目的僅在于選擇適當的能量采集來感知信道的數量。對于這樣的二進制完整規(guī)則樹,SU 的頻譜效率由下式給出: 其中D指的是要被感知的信道的數量(即,完整規(guī)則樹的統(tǒng)一深度)和A是可用信道數。由于每個授權信道的狀態(tài)為伯努利分布式隨機變量P[28],于是A變?yōu)槠谕麨镈P的二項分布隨機變量。因此,二進制完整規(guī)則樹問題可以表述為雙變量靜態(tài)優(yōu)化問題,由下式給出: 式中ρ-Dβ≥0,1-ρ-Dα≥0,0 ≤ρ≤1,D∈{0,1,...N} 如前所述方程式(2)由于設定場景下獲得可用信道的概率P是常數,故刪除。約束ρ-Dβ≥0,1-ρ-Dα≥0,0 ≤ρ≤1 旨在保證信道感知消耗的能量不應超過所有收獲的能量(能量約束),ρ-Dβ≥0,1-ρ-Dα≥0,0 ≤ρ≤1 是要保證所需時間應小于能量收集后的剩余時間(時間約束)。由此可得出0 ≤D≤1/(α+β)。 由于包含取整變量、離散變量以及連續(xù)變量,因此等式(11)屬于非常具有挑戰(zhàn)性的混合整數化非線性規(guī)劃(Mixed?Integer Non?Linear Programming,MIN‐LP)問題。首先,可以判斷(11)是一個凸問題,可通過求 解Karush?Kuhn?Tucker(KKT)最優(yōu)條件的方程組[24]得出全局最優(yōu)能量采集時隙占比ρ和要感知的信道數D。這里,因為導出的最佳信道數不一定是整數,通過求解KKT 方程組給出的全局最優(yōu)解不一定適用。所以,要將導出的最優(yōu)D取整,進一步導出適用的最優(yōu)節(jié)省比ρ。 當D≥0時,方程(11)的KKT 最優(yōu)條件由下式給出: 其中λi(i∈{ 1,2,3,4,5})為對偶變量。顯然,由于D=0,ρ=0,ρ=1,ρ-Dβ=0和1-ρ-Dα=0將導致期望鏈路頻譜效率為零,這不可能是最佳方案。所以取消諸如λi=0,i∈{1,2,3,4,5}這些榮譽的補充條件和對偶變量,通過簡單地求解以下方程系統(tǒng)即可推導出(12)的全局最優(yōu)解: 全局最優(yōu)解的(ρ**,D**)可表達為: 其中W(·)為Lambert W函數。 如前面所討論,被感知信道的全局最優(yōu)數目不一定是整數。因此,將n**取整到它兩個臨近的整數上,并分別推導出兩個相應的最優(yōu)能量采集時隙占比,然后在兩者中選擇最佳解作為原公式(2)問題的可行最佳解。在上述分析的基礎上,圖5 詳細描述了確定可行的最佳能量采集時隙占比和感知信道數目的過程。其中,Dh為取整時較大的整數,Dl為取整時較小的整數,最優(yōu)值與取整后的最優(yōu)值之間的差值定義為δ=D**?Dl=1?(Dh?D**)。概括地說,對于一個實際的CR 系統(tǒng),其授權信道的數量有限(如以前規(guī)定的N個授權信道),適用的最佳感知信道數量為min(D*,N)由于公式(7)中的目標函數的一致性,由公式(14)進一步可以得到適用的最優(yōu)能量采集時隙占比ρ**。 圖5 計算次優(yōu)能量采集時隙占比和感知信道總數目的流程圖 對于能量采集功率、頻譜感知時間和能源代價幾個參數變化時,最優(yōu)能量采集時隙占比和頻譜傳感規(guī)則對應的最優(yōu)解和次最優(yōu)解,本節(jié)用數值方法進行研究。設每個許可信道擁有1MHz 的帶寬,鏈路頻譜效率單位為bit/s/MHz。 對于最初公式(2)中隨機的二叉規(guī)則樹問題,使用最優(yōu)預期的感知信道數目(即預期最佳規(guī)則樹的深度)來評估頻譜感知規(guī)則,由下式給出: 圖6 和圖7分別給出了最佳能量采集時隙占比ρ*及期望感知信道數Nˉ隨不同的信道感知時間α和能量代價β(X=10 和P=0.5),可以看出,兩圖中都普遍存在時間或能量代價略有變化對最佳能量采集時隙占比或最佳頻譜感知規(guī)則沒有顯著影響的區(qū)域[24],如同中虛線內矩形區(qū)域。 圖6 最優(yōu)能量采集時隙占比與時間和能耗代價的關系 圖7 最佳預期感知信道數量和時間和能耗代價的關系 圖8 和圖9 顯示了不同的能量采集功率下可感知最佳能量采集時隙占比和預期信道數(T=1,P=0.5),能量采集功率越大,能量采集所用時間越少,則留給頻譜感知和數據傳輸的時間更多。以與此同時,隨著能量采集功率的提升,最佳頻譜感知規(guī)則樹的路徑深度越深,這就意味著每次都有足夠的能力感知更多的信道。 圖8 最佳能量采集時隙占比與能量采集功率 圖9 期望最佳感知信道數目與能量采集功率 對于改變后的各路徑補充完整的二進制規(guī)則樹,如圖10和圖11(X=10)所示,不同時間和能量代價下的次優(yōu)能量采集時隙占比和感知信道總數。圖中看出,為獲得克服頻譜感知的更高時間成本并提高期望鏈路頻譜效率,需要先獲得足夠的能量,隨著能耗的增加,SUs的更佳策略就要用更高的時間占比來收集能源。而隨著時間成本的增加,又傾向于用較短的時間收集能量,以確保有足夠的時間進行頻譜感知和數據傳輸。同時,頻譜感知的時間和能量成本越高,可被感知的信道也越少,而足夠的時間才能保證正常的數據傳輸,以提高鏈路頻譜效率。對于一個有限N個授權信道的實際CR系統(tǒng),要感知的信道的最優(yōu)數的上界是Nu,根據公式(14),次優(yōu)的能量采集時隙占比也有上限。 圖10 次優(yōu)能量采集時隙占比與時間和能耗的關系 圖11 次優(yōu)信道感知數量與N時間和能耗的關系 圖12 和圖13分別顯示了不同能量采集功率下的次優(yōu)能量采集時隙占比和次優(yōu)信道感知總數(T=1,Ts=0.02,Es=1),能量采集功率越大,能量采集所需的時間越少(包括全局最優(yōu)方案和次優(yōu)解決方案),這樣就有更多的時間用于頻譜傳感和數據傳輸。同時,隨著能源采集率的增加,也能感知更多的可用信道(包括全局最優(yōu)方案和次優(yōu)解決方案)。由于將全局最優(yōu)信道數取整運算,圖12 和圖13 中最佳能量采集時隙占比和能量代價及能量采集功率曲線呈“之字形”。其中虛線描述了一種全局次優(yōu)解決方案的收斂趨勢,隨著能量采集功率的增長,局部的次優(yōu)儲能方案收斂于全局次優(yōu)方案(如圖10所示)。在這個意義上,從系統(tǒng)設計的角度來看,全局次優(yōu)能量采集時隙占比方案適用于具有高效能量采集的CR系統(tǒng)。 圖12 次優(yōu)能量采集時隙占比和能量采集功率對比 圖13 次優(yōu)信道感知總數與能量采集功率的關系 本節(jié)根據公式(14)和仿真平均鏈路頻譜效率先研究PLOC 和次優(yōu)解決方案的性能,然后將次優(yōu)解決方案與一個將能量采集時隙占比與頻譜感知規(guī)則分開優(yōu)化的基本方案進行比較。構建一個具有10個授權信道的CR 系統(tǒng),通過生成隨機獲得可用信道的不同概率P的10個授權信道的各100個狀態(tài)樣本,每個時隙中將能量采集功率隨每個狀態(tài)樣本隨機變化,其服從δ?分布。 如圖14 所示,分別用最優(yōu)和次優(yōu)解決方案評估理論上的期望能量采集功率,通過方程式(2)和(11)中的公式計算最優(yōu)和次優(yōu)解的理論期望能量采集功率(E[X]=10),可以看出,隨著感知時間和能量成本的增加,最優(yōu)解決方案略微優(yōu)于次優(yōu)解決方案,數據吞吐量的相對性能卻隨著獲得可用信道的概率增加而縮小。這種對比變化原因在于,雖然最優(yōu)和次優(yōu)解都收斂到逐一檢測所有授權信道的方案,但獲得可用信道的概率信息與最優(yōu)解有關,而與次優(yōu)解無關。這可以通過比較圖6 和圖7 來印證,而圖10 和11 顯示了次優(yōu)解決方案往往具有較低的能量采集時隙占比和較高的期望感知信道總數。類似地,圖8 和圖9 顯示了次優(yōu)方案雖然獲得的能量較少卻能夠將大部分能耗用于信道感知,在概率上SUs 能夠獲得更多的可用信道,使得次優(yōu)方案的吞吐量接近最優(yōu)方案。 圖14 理論上可達到的吞吐量與授權信道的空閑概率 這意味著,在選擇兩個解決方案時應該在性能和計算復雜性之間進行權衡:對于一個具有較強計算能力的面向性能的CR系統(tǒng),最優(yōu)方案更可??;對于計算能力較低(如認知無線傳感器網絡)的能量受限的CR系統(tǒng),低復雜度的次優(yōu)解決方案更加適用。 對最優(yōu)與次優(yōu)解再進行1000個感知共享的狀態(tài)樣本進行仿真分析,平均可實現(xiàn)吞吐量的結果與圖15中的理論結果基本一致,即二者效果相當。 圖15 在200個時隙內,通信速率監(jiān)測和解耦的優(yōu)化方案 將次優(yōu)解決方案與具有200個仿真時隙的最優(yōu)解決方案進行比較,其中能量采集和頻譜感知的優(yōu)化彼此獨立,首先根據[29]中的分析結果優(yōu)化能量采集時隙占比,然后通過[10]中的最優(yōu)停止解決方案優(yōu)化剩余時間段的頻譜感知規(guī)則。使用次優(yōu)解決方案和解耦優(yōu)化解決方案在整個200個時隙上實現(xiàn)的信道數據傳輸總量的仿真結果如圖15所示(α=0.03,β=0.03和E[X]=10)。 可見,對于60%以上的感知共享過程,次優(yōu)解決方案優(yōu)于解耦優(yōu)化解決方案,有近40%次優(yōu)解決方案的吞吐量低于解耦優(yōu)化解決方案,但整體上次優(yōu)方案的均值更高。這是因為公式(11)的目標是最大化SUs的期望鏈路頻譜效率(在一個時間段內的平均值),而不是每次均優(yōu)于解耦最優(yōu)方案。 圖16顯示了具有不同能量采集功率E[X]的兩種解決方案的平均鏈路頻譜吞吐量(其他系統(tǒng)參數保持不變),顯然,能量采集功率E[X]越大,平均鏈路頻譜吞吐量越高。兩種解決方案都可以更好地利用所收集的能量,相對于能量采集功率均近似于的平均鏈路能量采集功率。更重要的是,替代的標準二叉樹規(guī)則樹解決方案總體上優(yōu)于所有將能量采集功率參數設置獨立的優(yōu)化解決方案,這表明能量收集和頻譜感知的聯(lián)合優(yōu)化方案實現(xiàn)了比解耦獨立優(yōu)化更好的性能。 圖16 不同能量采集功率的次優(yōu)和解耦優(yōu)化解決方案的均方值 為了更加合理利用授權頻帶空閑時間的頻譜資源,本文利用認知無線電的頻譜感知等關鍵技術對無線信道進行基于能效的收集和監(jiān)測,給出優(yōu)化頻譜子信道分配和功率分配的策略和方案,從而在保障主用戶PUs 服務質量的基礎上借用給次級用戶SUs 以提升頻譜利用效率。首先,構建了基于時隙和能量的頻譜分配模型,將期望通信速率的優(yōu)化問題轉化為POSP 問題。由于無線信道占用的時變性以及主用戶活動規(guī)律的隨機性,本文利用頻譜感知以及信令交互過程中的能量效率可用間接反映系統(tǒng)頻譜效率特點,提出了基于能量采集功率最優(yōu)的自適應動態(tài)優(yōu)比方法。為了提升計算效率、節(jié)省計算能耗、減少計算復雜度,利用上一次感知優(yōu)化的結果作為下一次感知的規(guī)則樹,形成了基于靜態(tài)公式化的方案來對信道共享進行預期規(guī)劃,推導出了最優(yōu)采集能量與感知計算消耗能量的平衡規(guī)則和可用信道的動態(tài)調整規(guī)則,得到了更高效的頻譜資源分配算法和最佳的能量管理策略。與在各區(qū)間跳轉以避免陷入局部區(qū)間并最終趨于全局最優(yōu)解的SAA算法相比,該算法在接近動態(tài)全局最優(yōu)算法效果的同時降低了計算周期、減小了對信道的占用時間,減少了計算能耗。實驗結果表明,該靜態(tài)次優(yōu)方案在性能接近自適應計算的全局動態(tài)最優(yōu)方案,特別是在獲得可用信道的概率較低、時隙小、計算能耗較高的苛刻條件下,簡潔高效的靜態(tài)次優(yōu)方案明顯優(yōu)于全局動態(tài)優(yōu)化的最優(yōu)方案。3.2 能量采集時隙占比優(yōu)化程度的評估
3.3 與退火算法的優(yōu)化能力對比
4 頻譜感知次優(yōu)方案
4.1 次優(yōu)問題的數學建模
4.2 次優(yōu)方案的規(guī)則設計
4.3 混合后的次優(yōu)解決方案
5 最優(yōu)解與次優(yōu)解的仿真結果及分析
5.1 最優(yōu)解決方案
5.2 次優(yōu)解決方案
6 性能評估
6.1 最優(yōu)和次優(yōu)解決方案的性能比較
6.2 與參數解耦分別優(yōu)化的性能比較
7 小結