王 維
(四川師范大學 信息網(wǎng)絡服務中心,成都 610066)
5G的高速、低時延特點推助了車間通信(Vehicle-to Vehicle,V2V)的應用[1].除了對數(shù)據(jù)傳輸時延以及可靠性具有苛刻的要求外,V2V的安全應用對車輛的狀態(tài)更新信息的新鮮度具有一定要求.信息年齡(Age of Information,AoI)是評估信息新鮮度的有效指標.依據(jù)美國羅格斯大學的Kaul等[2]對信息年齡(Age of Information,AoI)的定義:對于任意系統(tǒng),任意時刻的AoI表示目的端接收的最新更新信息自產(chǎn)生后所經(jīng)過的時間[3].
考慮到V2V的安全應用,從AoI角度實現(xiàn)通信的可靠性是十分必要的.事實上,如果AoI能夠預先地可靠地估計,就可提前分配傳輸功率[4]和資源塊(Resource Block,RB),進而保證通信的可靠性.因此,可將AoI超過預定閾值的概率定義為通信的可靠性.
然而,為了準確地估計未來的AoI,需要掌握網(wǎng)絡動態(tài)知識,即無線信道、車間干擾以及拓撲變化等信息.最近,研究人員開始關注車載網(wǎng)絡的AoI的優(yōu)化問題[5-7].
由于車載網(wǎng)絡動態(tài)變化,預先獲取網(wǎng)絡動態(tài)信息存在較大的挑戰(zhàn).基于在線集中式策略實時學習網(wǎng)絡動態(tài)信息和分配資源是一個可行的辦法[8].文獻[9]采用了模型預測控制(Model Predictive Control,MPC)策略.在確保系統(tǒng)性能優(yōu)化的同時,掌握動態(tài)系統(tǒng)的信息.然而,MPC需預先得到動態(tài)系統(tǒng)的準確數(shù)據(jù)模型,這在車載網(wǎng)絡中無法滿足.
基于高斯過程回歸(Gaussian Process Regression,GPR)是掌握動態(tài)系統(tǒng)信息的有效方法.GPR靈活,且對過度擬合[8]具有健壯性.與高斯混合模型(Gaussian Mixture Model,GMM)不同,GPR是非參數(shù)化的貝葉斯學習方法,其不受函數(shù)形式的約束[10].
為此,提出基于GPR的動態(tài)信息的捕獲算法GPR-PA.GPR-PA算法主動地學習系統(tǒng)的動態(tài)性,估計車輛的未來的AoI,優(yōu)化所分配的傳輸功率.仿真結果表明,提出的GPR-PA算法降低了AoI超標概率,降低了平均AoI.
考慮如圖1(a)所示的網(wǎng)絡模型.網(wǎng)絡內(nèi)有車、基站、行人和路邊單位(Roadside Unit,RSU)組成.由于本文只關注車間通信V2V,車與網(wǎng)絡(Vehicle to Network,V2N)、車與RSU(Vehicle-to-RSU,V2R)通信不在本文討論范圍內(nèi).
一對車輛的V2V稱為通信對模型,如圖1(b)所示.假定在一個RSU范圍的覆蓋范圍內(nèi)有M個通信對.車輛遵照Manhattan移動模型移動.M個通信對共享R個正交的RBs資源,且?guī)挒閃.
圖1 網(wǎng)絡模型和通信對模型
將通信時間軸劃分為多個時隙,且每個時隙長為τ.用t表示時隙的索引.對于任意一個通信對k,定義一個R維的功率分配矢量:
(1)
此外,對通信對k所分配的功率上限進行限定,如式(2)所示:
(2)
式中:R表示R個正交的RBs資源集;Pmax為可預支的最大功率.
每個通信對k均有隊列緩沖區(qū),用于緩存數(shù)據(jù).用Qk(t+1)表述隊列的動態(tài)變化:
Qk(t+1)=max(Qk(t)-Ik(t),0)+A
(3)
式中:Qk(t)表示在時隙t通信對k的隊列長度;A表示每個時隙的周期的數(shù)據(jù)包到達率;Ik(t)表示在時隙t通信對k的傳輸率,單位為每個時隙傳輸?shù)臄?shù)據(jù)包數(shù).
(4)
GPR-PA算法有兩個目標.第1個目標就是提高狀態(tài)信息更新的可靠性;第2個目標就是掌握動態(tài)系統(tǒng)的知識.先將這兩個目標進行數(shù)學表述,并聯(lián)立這兩個目標建立目標函數(shù),再利用算法1求解,得到最優(yōu)每個通信對的最優(yōu)的功率分配值.GPR-PA算法的整個框架如圖2所示.
圖2 GPR-PA算法框架
用AoI評估信息的新鮮度.令Δk(t)表示通信對k在時隙t的開始時刻的AoI,其定義如式(5)所示:
Δk(t)=τt-γk(t)
(5)
式中:γk(t)表示通信對k接收最新信息的時刻.AoI與信道增益、干擾以及所分配的功率相關.因此,利用非線動態(tài)系統(tǒng)函數(shù)fk(·)估計下一時隙的AoI:
Δk(t+1)=fk(Δk(t),Pk(t))
(6)
在動態(tài)系統(tǒng)中,Δk(t)∈R+表示系統(tǒng)狀態(tài).Pk(t)∈p表示在時隙t的控制動作.通過fk:R+×p→R+將控制動作映射到系統(tǒng)狀態(tài)[8].
利用歷史數(shù)據(jù)估計fk(·)是一個遞歸問題.采用GPR,對式(6)進行轉換.為了簡化符號,令yi=fk(xi),其中xi=[Δk(i),Pk(i)]表示第i個歷史數(shù)據(jù)輸入點;yi=Δk(i+1)表示對應的標量輸出.
GPR為非線性回歸量,其表述了輸入與輸出關系.為此,假定fk(·)的先驗分布服從高斯過程(Gaussian Processes,GP)[11].注意,此假定并不意味著其完全服從高斯分布,但是給定的協(xié)方差函數(shù),GP仍可看作一個最大熵過程(Maximum Entropy Process).
C=[c(xi,xj)]ij,?xi,xj∈Dk
(7)
(8)
(9)
式中:c*=[c(x*,x1)…c(x*,xD)]T.y=[y1…yD]T[11].
GPR的計算復雜度隨D的增加呈線性快速增長[9].然而,由于車載網(wǎng)絡的動態(tài)特性,通過丟棄舊的數(shù)據(jù)使數(shù)據(jù)庫D固定,能夠應對計算GPR的復雜度,同時,也不影響GPR性能.
利用協(xié)方差函數(shù)c(xi,xj)可完備地定義一個GP.為了準確地估計未來的測量有及它們的分布,選擇一個協(xié)方差函數(shù).為此,引用Matern類協(xié)方差函數(shù)[12]學習fk(·):
(10)
式中:Γ(·)表示標準的Gamma函數(shù);B(·)表示二階的修正的Bessel函數(shù);Matern類協(xié)方差函數(shù)包括當ν=0.5時的指數(shù)自校正函數(shù)和當ν→∞時高斯校正函數(shù).
(11)
(12)
算法1.
輸入值:P,αc,αi,D;
初始化:Δk(0)=0,Dk=φ,selectPk(0)∈prandomly
endfor
如算法1所示,第1步,建立輸出入值:p、αc、αi和D;第2步,進行初始化:Δk(0)=0,Dk=φ,并從p中隨機一個值賦予Pk(0);第3步,進入循環(huán)運算.在每個時隙t,觀察Δk(t),并向數(shù)據(jù)庫里添加所觀察的數(shù)據(jù),如式(13)所示:
Dk=Dk∪([Δk(t-1),Pk(t-1),Δk(t)])
(13)
再判斷Dk內(nèi)的數(shù)據(jù)量是否超過D.若超過就去除最優(yōu)的數(shù)據(jù),進而保證Dk內(nèi)的數(shù)據(jù)量不超過D.
考慮250m×250m區(qū)域大小的曼哈頓(Manhattan)移動模型[13,14].Manhattan模型由一定多條水平與豎直的街道組成,每條道為雙向道,如圖3所示.在每個車道的交叉口,移動點可直行、或者左拐、右拐.另外,節(jié)點的速度還受到同方節(jié)點速度的約束.
圖3 Manhattan模型
仿真參數(shù)如表1所示.車輛的平均速度為60 km/h.每個通信對間距離為15m[15].仿真的總時隙為5000 時隙.利用GPML 工具箱求解GPR[16].
表1 仿真參數(shù)
在仿真過程中,考慮不同的狀態(tài)更新到達率為500kbps、1Mbps.并選擇兩個基準(Baseline)為參照,分析GPR-PA算法的性能.Baseline1:每個通信對隨機分配功率,不進行系統(tǒng)動態(tài)信息的學習;Baseline 2:每個通信對主動學習動態(tài)信息,并基于αi=0求解式(11).
首先,分析不同的狀態(tài)更新達到率的輔助累加分布函數(shù)(Complementary Cumulative Distribution Function,CCDF),其反映了AoI超標概率,如圖4、圖5所示.
圖4 CCDF曲線(狀態(tài)更新到達率為500kbps)
圖5 CCDF曲線(狀態(tài)更新到達率為1Mbps)
圖4給出了AoI對CCDF的影響,其中狀態(tài)更新到達率為500kbps.從圖4可知,CCDF隨AoI的增加而下降.原因在于:AoI越大,超標概率越低.相比于Baseline1,Baseline2和Proposed的性能得到優(yōu)化.
圖5給出了在狀態(tài)更新到達率為1Mbps時,CCDF曲線隨AoI的變化情況.相比于到達率500kbps時,到達率為1Mbps時的AoI的超標概率隨AoI增加而下降的速度更快.在AoI=10ms時,GPR-PA算法的CCDF已降至0.0001.
本小節(jié)分析不同數(shù)據(jù)庫容量D對下一個時隙的AoI估計的性能,并選用根均方誤差(Root Mean Square Error,RMSE)作為性能指標:
(14)
圖6給出不同數(shù)據(jù)庫容量D對估計性能和超標概率的性能影響,其中R=20,αc=1.從圖6(a)可知,當D≤200時,GPR-PA算法估計的根均方誤差RMSE隨數(shù)據(jù)庫容量D的增加而下降,并且下降速度較大.當D>200后,RMSE隨D的增加呈緩慢增長,估計的誤差開始增加.這說明,并非數(shù)據(jù)庫容量D越大,估計精度越高.原因在于:車載網(wǎng)絡動態(tài)變化,歷史觀察數(shù)據(jù)的不確定.
圖6 數(shù)據(jù)庫容量D對估計性能和超標概率的影響
圖6(b)給出概率Pr{Δ(t)>d}隨數(shù)據(jù)庫容量D的變化情況.該曲線趨勢與圖6(a)相類似.在D≤200時,概率Pr{Δ(t)>d}隨D的增加而快速下降.在D>200后,概率Pr{Δ(t)>d}隨D的增加反而上升,但上升速度變慢.
圖7(a)給出GPR-PA和Baseline2的超標概率Pr{Δ(t)>d}隨αi的變化情況.其中Baseline2表示每個通信對主動學習,但αi=0.結合式(11)可知,αi=0意味在功率分配時,不考慮AoI方差.
從圖7(a)可知,當權重系數(shù)αi達到100后,AoI的超標概率下降.而αi達到100后,超標概率上升,性能下降.原因在于:αi值越大,每個通信對就更傾向選擇控制動作,學習更多的系統(tǒng)知識,而不是降低AoI的超標概率.并且當αi大于200后,GPR-PA算法的超標概率大于Baseline2的超標概率.這表明,并非數(shù)據(jù)庫容量D越大,性能越優(yōu),需合理地選擇數(shù)據(jù)庫容量D.
圖7 αi對平均AoI和超標概率的影響
圖7(b)給出了平均AoI隨αi變化曲線,其與圖7(a)曲線類似.在αi小于100時,αi的增加,能夠降低平均AoI,提高了信息的保鮮度,并且優(yōu)于Baseline2環(huán)境下的性能.當αi大于100后,平均AoI不再隨αi的增加而下降,反而上升.
本文針對動態(tài)的車載網(wǎng)絡,對傳輸功率和RB的分配進行了研究,其主要目的就是在下一時隙AoI超過閾值的概率與最大化學習動態(tài)系統(tǒng)知識間達到平衡.GPR-PA算法通過GPA主動學習網(wǎng)絡的動態(tài)信息,并估計下一時隙的AoI.仿真結果表明,相比于其他基準算法,提出的GPR-PA算法降低了AoI超過閾值的概率.