王軍艷 賈向東,2 魏哲敏 許 晉
(1.西北師范大學(xué)計算機科學(xué)與工程學(xué)院,甘肅蘭州 730070;2.南京郵電大學(xué)江蘇省無線通信重點實驗室,江蘇南京 210003)
隨著物聯(lián)網(wǎng)設(shè)備數(shù)量的快速增長,物聯(lián)網(wǎng)無線網(wǎng)絡(luò)目前面臨的一個巨大挑戰(zhàn)便是無線電頻譜資源的稀缺性,認知無線電(Cognitive Radio,CR)技術(shù)的出現(xiàn)很好地解決了頻譜稀缺的問題。CR 技術(shù)可以感知周圍無線頻譜環(huán)境,對無線信道進行實時監(jiān)測,在保證主用戶(Primary User,PU)服務(wù)質(zhì)量的基礎(chǔ)上允許次用戶(Second User,SU)接入使用,從而更加有效地提高頻譜利用率[1]。CR 模式可分為三大類:交織、底層和覆蓋[2]。在交織模式中,SU 可以隨機接入未被占用的信道。在底層模式中,只要SU發(fā)送信號的功率低于干擾閾值或干擾程度,SU就可以與PU 共存[3]。覆蓋模式下,SU 可與PU 共存,但SU必須擁有完整的PU信號信息。
在如車輛網(wǎng)絡(luò)和信息物理系統(tǒng)(Cyber-Physical Systems,CPS)監(jiān)控等各個領(lǐng)域的物聯(lián)網(wǎng)應(yīng)用中,需要大量的實時數(shù)據(jù)信息做支撐。因而需要不同功能目標的傳感器節(jié)點實時感知周圍物理環(huán)境并動態(tài)監(jiān)測系統(tǒng)的狀態(tài)變化,對于這類異構(gòu)的傳感器節(jié)點,在多接入信道的環(huán)境下能否向目標接入點提供及時且有效的信息就顯得尤為關(guān)鍵[4]。其中信息年齡(Age of Information,AoI)的概念在2011 年被提出[5],它在接收端的角度來量化信息的新鮮度。當前,隨著市場上各類新型應(yīng)用場景的出現(xiàn),實時且具備能量收集(Energy Harvesting,EH)傳感器的部署被視作高效節(jié)能和自我可持續(xù)網(wǎng)絡(luò)的一種有效解決方案。
文獻[6]針對具有EH的無線傳感器網(wǎng)絡(luò)(Wire?less Sensor Network,WSN)場景,綜合考慮了傳感器的AoI 和傳輸成功率之間的關(guān)系,對AoI 進行了優(yōu)化。文獻[7]為了向用戶提供上下文感知服務(wù),減輕傳輸負擔,使用馬爾科夫決策過程將計算和傳輸過程進行建模并推導(dǎo)了多傳感器下的平均峰值A(chǔ)oI的優(yōu)化問題。文獻[8]在給定更新數(shù)量的約束下,優(yōu)化從EH 源發(fā)送更新的過程以最小化更新的平均AoI。文獻[9]研究了有限電池容量的源通過泊松能量到達來間歇性充電的年齡-能量權(quán)衡問題。文獻[10]研究了具有噪聲信道的EH 源的最優(yōu)狀態(tài)更新策略以最小化接收端的長期平均AoI。文獻[11]研究了碰撞約束下的CR-IoT 系統(tǒng)AoI 最小化問題,其中作為SU 的物聯(lián)網(wǎng)設(shè)備尋找并利用其PU 空出的許可頻段,在不對PU 造成影響的情況下交付狀態(tài)更新。文獻[12]研究了能量收集認知無線電下的AoI 最小化問題,但其考慮的是單個次用戶的情況。文獻[13]研究的是無人機作為移動中繼來輔助認知無線電網(wǎng)絡(luò)中的信息新鮮度優(yōu)化。
當前,雖然已有許多針對AoI 分析和優(yōu)化的研究,但大多考慮的是單接入信道或多接入信道的正交調(diào)度。本文在以上研究的基礎(chǔ)上考慮了認知無線電網(wǎng)絡(luò)中兩個次用戶接入的情況,在底層模式下優(yōu)化EH 節(jié)點的平均AoI,以有效提高網(wǎng)絡(luò)的實時性。
本文考慮如圖1 所示的CR-IoT 網(wǎng)絡(luò),它由PU,主接入點(Primary Access Point,PAP),以及一個SU系統(tǒng)組成。其中SU 包含兩個異構(gòu)的傳感器源節(jié)點S1,S2和次接入點(Secondary Access Point,SAP)。該模型中,PU 具有頻譜訪問權(quán)限,次用戶S1和S2的發(fā)送功率受到干擾閾值的限制。PU 和S1有穩(wěn)定的電源接入,更新的數(shù)據(jù)包分別按照參數(shù)為ω和λ的伯努利過程發(fā)送到對應(yīng)接入點。其中PU 沒有緩沖區(qū),主數(shù)據(jù)包在到達后會立即傳送。用Q(t)表示節(jié)點S1在時隙t的數(shù)據(jù)隊列大小,假設(shè)隊列大小沒有限制。EH 傳感器S2監(jiān)測系統(tǒng)的隨機過程并向目標接入點SAP 發(fā)送狀態(tài)更新,S2需要從外界環(huán)境不斷收集能量,假設(shè)S2的電池充電過程也服從概率為δ的伯努利過程,用B(t)表示S2在時隙t的電池能量單元數(shù)。此外,該模型可以推廣到多個主用戶的分析場景,但為了簡單起見,本文只討論了簡化的模型,以突出主用戶對次用戶AoI的影響。
其中G表示整個系統(tǒng)中當前活躍的發(fā)射器集合,hi,hji分別表示次鏈路和干擾鏈路的小規(guī)模信道衰落并服從獨立同分布的瑞利衰落,且h12=h1,h21=h2。
在SU 系統(tǒng)傳送時,考慮PU 工作和空閑兩種情況。用γi表示成功傳輸時的SNR 或SINR 閾值,根據(jù)指數(shù)分布概率密度函數(shù)的定義:
(1)對于SU 系統(tǒng)單個節(jié)點傳送的情況,PU 空閑時:
(2)對于S1和S2在同一時隙傳送,PU空閑時:
SU系統(tǒng)中節(jié)點S2的信息年齡更新如下:
文中考慮的是有時隙的離散時間系統(tǒng),其中tk表示目標接入點接收到第k個更新的時刻,Yk+1是tk到tk+1之間階躍線下方的總面積,Xk+1是第k個和第k+1個狀態(tài)更新被成功接收需要的時隙數(shù)。
使用最新提出的度量指標AoI,并假設(shè)每一次的狀態(tài)更新都以數(shù)據(jù)包的形式傳輸,在時隙t,目標節(jié)點的AoI 定義為當前時刻t與最近一次目標節(jié)點成功接收數(shù)據(jù)包的更新時刻U(t)之間的差值。時隙t的AoI為:
在考慮有時隙的傳輸時,AoI 取的是整數(shù)值,即A(t) ∈{1,2,…},如圖2 所示。AoI 在兩個連續(xù)時隙之間的迭代過程可以表示為:
則平均AoI定義為:
本文中,由于認知無線電系統(tǒng)下PU 和SU 共享相同的無線信道,且PU 是否占用信道會對SU 系統(tǒng)產(chǎn)生影響。用Π={ui(t) ∈{0,1},?t,i={1,2}}來定義調(diào)度策略空間,其中ui(t)表示節(jié)點i在時隙t的調(diào)度決策。ui(t)=1 意味著節(jié)點Si在時隙t被調(diào)度傳輸,ui(t)=0 表示節(jié)點Si在時隙t處于閑置狀態(tài)。本文的目標是找到一個最優(yōu)的調(diào)度策略π∈Π,以最小化節(jié)點S2的平均AoI。最優(yōu)化問題定義為:
SU 中兩個傳感器節(jié)點的隨機傳輸決策按照平穩(wěn)的概率分布。為在穩(wěn)定約束下求解AoI最小化問題,首先表示S1的穩(wěn)定性條件。然后求解S2的AoI。
(1)S1的穩(wěn)定性分析
S1的服務(wù)概率表示為當節(jié)點S1試圖傳輸一個數(shù)據(jù)包時的傳輸成功概率。在考慮PU 工作和空閑兩種模式下,通過求解以下三種情況的成功概率得到:S2電池為空;S2電池非空但不決定傳輸;S2決定傳 輸。令p′=p1/1+p1/1,3,p″=p1/1,2+p1/1,2,3,節(jié) 點S1的服務(wù)概率為:
S1隊列穩(wěn)定當且僅當λ 對X的二階矩兩邊取條件期望,計算可得: 將式(14)和(16)代入式(13),平均AoI為: 這里T代表兩個連續(xù)嘗試傳輸?shù)臅r間差,由T的概率質(zhì)量函數(shù)推導(dǎo)可得: 將式(18)代入式(17),使用PRA 策略,當節(jié)點S1的數(shù)據(jù)隊列穩(wěn)定(λ 當δ 平均AoI優(yōu)化問題可以表示為: 由文獻[15],最優(yōu)傳送概率q1和q2的取值: q2≤1滿足隊列穩(wěn)定性條件,最優(yōu)解為: 表1 決策與傳輸概率關(guān)系Tab.1 Relationship between decision and transmission probability 平均AoI 優(yōu)化:用H(t)表示電池狀態(tài),B(t) >0時,H(t)=1;節(jié)點S2的成功傳輸過程定義為b2(t)=1{S|D(t)}。平均AoI更新為: AoI優(yōu)化問題表示為: 本文使用Matlab對算法進行了仿真。實驗中使用的主要參數(shù)如下:信噪比閾值γi=3 dB;干擾閾值Th=0.8745;S1和S2最大發(fā)射功率p1=13 dBm,p2=10 dBm,噪聲功率σ2=1 dBm,鏈路增益βi=1 dBm(i=1,2,3)。PRA策略中,ζ設(shè)置為0.001;DPP策略中,V=200且αmax=1。 圖3 給出了λ=0.2 和λ=0.75 時使用PRA 和DPP 策略得到的平均AoI 隨δ遞增的變化趨勢??梢钥闯?,λ相同時,使用DPP 策略得到的平均AoI 總是優(yōu)于PRA 策略。且隨著δ增加,平均AoI 逐漸減?。淮送?,當λ=0.75時,平均AoI在δ達到一定的值后不再變化;這是因為S2的平均AoI 主要受到能量離開過程的限制而不是到達過程。 圖4給出了在δ一定,PU發(fā)射功率不同時,平均AoI 隨著λ遞增的變化趨勢。對比曲線可以看出,當發(fā)射功率增大時,平均AoI的值會相應(yīng)增大,這是因為PU 發(fā)射功率增大時會對SU 帶來更多干擾,導(dǎo)致傳輸成功率降低。 圖5 給出了DPP 策略下SU 系統(tǒng)中每類調(diào)度決策與數(shù)據(jù)到達概率之間的關(guān)系。圖中兩個并發(fā)傳輸?shù)母怕适冀K為零,SU 中節(jié)點S1的調(diào)度概率隨著λ的增加而增加。當λ=0.4時,兩個節(jié)點空閑的百分比變?yōu)?,信道中沒有空閑時隙。表明DPP 策略會充分利用信道中的傳輸機會。 圖6 中,研究了不同V值對CR-IoT 系統(tǒng)中時間平均AoI收斂速度的影響,對于仿真時間,我們選擇了足夠長的時間來確保DPP 算法的收斂。從圖中可以看出,V值越大時得到的時間平均AoI 會相應(yīng)減小,并且收斂速度也會降低。 本文基于CR-IoT 系統(tǒng),提出了一個在SU 發(fā)射功率約束和PU 干擾閾值條件下多接入信道EH 傳感器節(jié)點的平均AoI最優(yōu)化問題。通過理論分析和仿真實驗結(jié)果可知,該場景下DPP 策略要明顯優(yōu)于PRA 策略,能夠有效提升系統(tǒng)的時效性和數(shù)據(jù)包的新鮮度。在未來的研究工作中,可以考慮在多信道接入的CR 無線網(wǎng)絡(luò)場景下,結(jié)合主次用戶能量消耗和吞吐量約束下的AoI 優(yōu)化問題,使之能夠在提升數(shù)據(jù)傳輸及時性的同時降低傳輸?shù)哪芎模岣邆鬏斝?,以滿足更多的應(yīng)用需求。3.2 漂移加罰策略
4 仿真結(jié)果及分析
5 結(jié)論