雷維嘉 付安琦 雷宏江 謝顯中
①(重慶郵電大學通信與信息工程學院 重慶400065)
②(移動通信技術重慶市重點實驗室 重慶400065)
③(西安郵電大學陜西省信息通信網絡及安全重點實驗室 西安710121)
④(重慶郵電大學光電工程學院 重慶 400065)
從周邊環(huán)境中收集能量,并將其轉化為電能支持通信網絡的運行,是一種減少傳統(tǒng)能量消耗、減輕環(huán)境污染的綠色通信技術[1]。能量收集(Energy Harvesting,EH)技術是解決物聯(lián)網(Internet of Things,IoT)這種節(jié)點眾多的網絡中,節(jié)點供電問題的有效手段。由于環(huán)境中的能量源具有較大的波動性,雖然一般都配備有充電電池對能量進行緩沖,但收集能量節(jié)點的電量供應仍然存在較大的不穩(wěn)定性和不確定性。而無線通信系統(tǒng)中還存在信道的隨機衰落,如何根據收集能量的情況和信道的衰落狀態(tài),對能量使用進行合理的調度是影響EH系統(tǒng)性能的重要因素,其中發(fā)送機的發(fā)送功率控制是目前研究較多的問題。相關文獻中提出的功率控制策略可分為離線控制策略和在線控制策略兩類。離線控制策略需要提前獲得整個通信過程中信道衰落狀態(tài)和能量到達過程的信息,實際上是一種不可實用的策略,但其一般具有較好的性能,常作為相同系統(tǒng)模型下在線策略研究時的性能參考。在能量到達時間和數量事先已知的條件下,文獻[2]研究源節(jié)點由EH裝置供電且配備容量無限大電池時,采用離線功率控制策略時加性高斯白噪聲(Additive White Gaussian Noise,AWGN)信道的容量。文獻[3]針對源節(jié)點和中繼具有EH裝置的三節(jié)點正交中繼信道,在能量到達時間和數量事先已知的前提下,對源和中繼的發(fā)送功率進行優(yōu)化控制,最大化吞吐量。在線控制策略不要求事先獲得能量收集和信道衰落情況,是可能實用的策略。在可獲得能量到達和信道衰落的統(tǒng)計信息的情況下,將功率控制問題建模為馬爾科夫決策過程(Markov Decision Process, MDP)并應用動態(tài)規(guī)劃(Dynamic Programming,DP)求解是相關文獻中研究較多的在線功率控制解決方案。如文獻[4]研究有限時間范圍內點對點系統(tǒng)時間選擇性衰落信道上的在線功率控制問題,以平均系統(tǒng)速率最大化為目標,將能量到達和信道衰落建模為1階馬爾可夫過程,并通過DP得到線功率控制策略。若可將能量到達和信道狀態(tài)建模為馬爾科夫過程,但不知道狀態(tài)轉移概率時,利用機器學習獲得功率控制的優(yōu)化解也是目前研究較多的在線解決方案[5]。Lyapunov優(yōu)化技術[6]是一種在控制論中使用較為廣泛的優(yōu)化方法,其根據當前的系統(tǒng)狀態(tài)進行決策,最初用于求解排隊問題,但非排隊問題也可以求解。將優(yōu)化問題中約束轉化為虛隊列,通過保持虛隊列的穩(wěn)定來間接地滿足約束條件是Lyapunov優(yōu)化框架求解約束優(yōu)化問題的基本思路。將要優(yōu)化的目標作為懲罰項,與反映隊列穩(wěn)定情況的隊列漂移一起構造“漂移加懲罰”,通過使瞬時“漂移加懲罰”最小化實現優(yōu)化目標。由于Lyapunov優(yōu)化框架不需要知道未來的系統(tǒng)狀態(tài),也不需要獲得系統(tǒng)狀態(tài)的統(tǒng)計信息,因此是一種非常具有實用性的優(yōu)化方法,近年來已有文獻用其來解決通信網絡中的資源分配問題[7],也有少量文獻用其求解能量收集通信系統(tǒng)中的功率控制問題。文獻[8]研究源節(jié)點由EH裝置供電的點對點通信系統(tǒng),在僅知當前電池狀態(tài)和信道衰落狀態(tài)的條件下,提出利用Lyapunov優(yōu)化框架最大化長期平均速率的算法。算法中,將加偏移的電池電量作為虛隊列,待最大化的速率的負數作為懲罰項,構建“漂移加懲罰”項,通過最小化其上界,在保持電池電量穩(wěn)定的同時最大化傳輸速率。文獻[9]進一步研究EH兩跳放大轉發(fā)中繼網絡中的傳輸速率最大化問題,利用Lyapunov優(yōu)化框架將長期平均速率最大化問題轉化為單時隙的源節(jié)點和中繼的發(fā)送功率聯(lián)合優(yōu)化問題。
由于無線信道的開放性,無線通信系統(tǒng)中的信息傳輸過程易遭受攻擊,安全問題是一個重要的問題。物理層安全采用物理層技術,利用無線信道隨機時變衰落特性實現信息的安全傳輸。目前研究較多的物理層安全技術包括安全波束賦形技術[10]、人工噪聲技術[11]、協(xié)作通信技術[12]等。近年來有文獻針對能量收集通信系統(tǒng)中的物理層安全技術進行了研究,如文獻[13]針對多中繼攜能傳輸網絡,研究了轉發(fā)中繼節(jié)點和協(xié)作干擾節(jié)點的選擇問題與優(yōu)化方案。
本文研究能量收集中繼通信系統(tǒng)中以優(yōu)化物理層安全傳輸能量效率為目標的功率控制問題。系統(tǒng)模型中包括1個源節(jié)點、1個中繼節(jié)點和2個目的節(jié)點,2個目的節(jié)點的信息需要相互保密。每個時隙,源節(jié)點選擇向其中一個目的節(jié)點傳輸保密信息。源節(jié)點和目的節(jié)點之間沒有直連鏈路,信息的傳輸需要經過中繼節(jié)點轉發(fā)。中繼采用放大轉發(fā)協(xié)議。源節(jié)點和中繼節(jié)點處均配備有能量收集裝置和可充電電池,它們發(fā)送信號的能量來自從周圍環(huán)境中收集的能量。在能量到達過程隨機、信道為時變衰落信道,且電池容量受限條件下,利用Lyapunov框架解決源節(jié)點和中繼節(jié)點發(fā)送功率的聯(lián)合控制問題,最大化長期時間平均保密速率,同時兼顧兩個目的節(jié)點不同的數據傳輸服務需求。相比較基于MDP的算法,本文算法不需要能量到達和信道衰落的統(tǒng)計信息,而且復雜度更低,是一種實用的算法。
本文系統(tǒng)模型如圖1所示,為中繼傳輸系統(tǒng),包括1個源節(jié)點S、1個中繼節(jié)點R和2個目的節(jié)點Dk(k=1,2)。源節(jié)點和中繼節(jié)點配備能量收集設備和容量有限的充電電池,從周圍環(huán)境中收集能量并存儲在電池中,用于信息的傳輸。源節(jié)點配備數據緩沖器用于緩存發(fā)送給2個目的節(jié)點的數據。所有節(jié)點工作在半雙工模式,中繼采用放大轉發(fā)協(xié)議。記源節(jié)點到中繼節(jié)點、中繼到2個目的節(jié)點之間的信道系數分別為hR(t),hk(t)(k=1,2)。1個信息的傳輸過程為1個時隙,分為等長的兩個階段,先由源節(jié)點發(fā)送信息給中繼,中繼再轉發(fā)給目的節(jié)點。信道系數在1個時隙內保持不變??紤]2個用戶信息需要相互保密的安全傳輸場景,即每次傳輸時其中一個目的節(jié)點為合法接收者,另一個目的節(jié)點視為竊聽者。
圖1 具有能量收集裝置的兩跳傳輸模型
其中,當k=1時,kˉ=2;當k=2時,kˉ=1。
保密速率與各信道的衰落情況、源節(jié)點和中繼節(jié)點的發(fā)送功率有關,而可用發(fā)送功率受到電池電量的約束,保密速率最大化問題是在能量約束下源和中繼節(jié)點發(fā)送功率的聯(lián)合優(yōu)化問題。
問題P2可采用Lyap unov優(yōu)化框架來解決。Lyapunov優(yōu)化從隊列的穩(wěn)定性出發(fā),將約束條件的滿足用保持隊列穩(wěn)定來實現,而優(yōu)化目標作為懲罰項,構建“漂移加懲罰”,通過最小化“漂移加懲罰”來實現滿足約束條件下的性能優(yōu)化。本文優(yōu)化的對象是長期時間保密速率,優(yōu)化過程中應該保持電池電量的穩(wěn)定性。將源節(jié)點和中繼節(jié)點的電池電量加一個偏移量后作為能量虛隊列:
其中,E[Rs(t)]是優(yōu)化的目標—平均保密速率,將其負值作為懲罰項,V0是漂移和懲罰項之間的權重,為正常數,用于在隊列穩(wěn)定性和保密速率最大之間取得平衡。通過最小化漂移加懲罰項在滿足虛隊列,即電池電量穩(wěn)定的同時最大化保密速率。由于虛隊列是在電池隊列后添加偏移量得到的,類似式(11)有
優(yōu)化問題P4中含有發(fā)送功率的不等式約束條件,采用KKT條件求解。
當g1(t)>g2(t)時,向D1傳 輸保密信息,Rs(t)為式(8a),優(yōu)化目標函數為
定義拉格朗日函數為
仿真中,時隙長設置為? t=1 s,如無特別說明,其他仿真的參數設置如下。源和中繼節(jié)點的電池電量最大和最小值為Emax=10 J,Emin=0 J;能量到達過程服從復合泊松分布,源和中繼節(jié)點的能量到達率為η1=η2=1單位/時隙,每個單位能量服從[0,0.4]J的均勻分布;每時隙源節(jié)點的數據到達量W1(t)和W2(t)分別服從到達率為0.07 bit/時隙和0.05 bit/時隙的泊松分布;源和中繼節(jié)點電池最大充電速率和放電速率均設為1 W;兩跳的信道均為瑞利衰落信道,各信道系數均為服從均值為0、方差為1的復高斯分布隨機變量;電池的初始能量為10 J;偏移量AS=AR=5;V=6,U=10。
為了比較本文算法的性能,與4種算法進行對比。(1)全功率貪婪算法:在最大功率的限制條件下,每個時隙源和中繼節(jié)點均根據電池中可用電量的最大值設置發(fā)送功率。(2)半功率算法:在最大功率的限制條件下,每個時隙源和中繼節(jié)點均以電池中可用電量的一半設置發(fā)送功率。(3)隨機功率算法:每個時隙源和中繼節(jié)點在電池可用電量范圍內等概隨機選取功率值。(4)離線注水算法:發(fā)送端在傳輸前就已知整個傳輸過程中信道的變化情況和能量收集的情況,根據收集到的總能量得到傳輸過程中的信號平均發(fā)送功率。在此平均功率的約束下,采用注水原理根據信道狀態(tài)確定各時隙的發(fā)送功率。此算法不考慮數據和能量的因果性,也不考慮電池溢出以及數據緩沖器的溢出,實際應用中是不可實現的,但具有最優(yōu)的性能,可用于評估本文算法的性能。
圖2是幾種算法平均保密速率隨著時間變化的軌跡圖。每時隙的平均保密速率為仿真開始到當前各時隙保密速率的平均值。從圖2可知本文提出的算法性能略低于離線注水算法,但明顯優(yōu)于其他幾種算法。幾種算法中,貪婪算法性能最差,隨機功率算法僅略好于貪婪算法。全功率、半功率和隨機功率算法都沒有根據能量收集情況和信道狀態(tài)對功率進行控制,其中全功率貪婪算法完全根據前一時隙所收集能量來決定當前時隙的發(fā)送功率,性能最差。半功率算法雖然考慮保留部分能量供后面的時隙使用,但也只是簡單地將能量一分為二,當前時隙使用1/2,也沒有考慮信道狀態(tài)。本文算法根據信道狀態(tài)和電池電量聯(lián)合優(yōu)化源節(jié)點與中繼節(jié)點的發(fā)送功率,因此具有較好的性能。注水算法在傳輸前就已知信道狀態(tài)和能量收集情況,根據信道狀態(tài)進行全局功率分配,且不受能量和數據達到因果性限制,因此性能最優(yōu)。
圖3—圖6給出了系統(tǒng)參數對系統(tǒng)性能的影響情況,所給出的結果都是整個T=105s的仿真過程中的平均值。圖3(a)為電量虛隊列偏移量變化時保密速率的變化情況。當偏移量較小時,保密速率隨著偏移量的增大而增加,但當偏移量增加到一定數值時,保密速率反而隨其增大而下降。這是因為偏移量較小時,源節(jié)點和中繼節(jié)點的電池中保留的電量較少,可支持的最大發(fā)送功率也較小。根據注水定理,當信道條件較好時,應使用較高的功率傳輸信息,可獲得更高的能量效率。由于此時可支持的最大功率較小,限制了信道條件較好時的傳輸速率,導致平均保密速率較低。隨著偏移量增加,電池保留的電量增加,如圖3(b)所示,可支持的最大功率也在增加,對能量的利用效率也在提高,故平均保密速率增大。而當偏移量增大到一定程度時,發(fā)送功率受限于最大放電速率而不再增大,而電池的剩余存儲空間減小,出現收集的能量不能全部存入電池,即電池發(fā)生溢出、部分收集能量丟棄的概率增大,反而會導致保密速率的下降。
圖2 與對比算法平均保密速率的比較
圖3 能量虛隊列偏移量對系統(tǒng)性能的影響
圖4給出了能量到達率對系統(tǒng)性能的影響情況。隨著能量到達率η1和η2的增大,每個時隙到達能量的平均值增加,相應平均發(fā)送功率增大,平均保密速率增大。能量到達率增加到一定值后,平均保密速率不再隨其增大而繼續(xù)增大,這是因為發(fā)送功率有最大值限制,收集能量的數量也受到電池容量、電池充電速率的限制。
圖4 能量到達率對長期平均保密速率的影響
圖5、圖6給出了漂移加懲罰項中權重V、調整系數U對系統(tǒng)性能的影響情況。用整個仿真期間兩個數據隊列長度差的均方根值(時間平均)來反映算法對兩目的節(jié)點數據傳輸需求的適應情況,該值越小,適應情況越好。電池電量的穩(wěn)定性用整個仿真期間電池電量的標準差(時間平均)來衡量,標準差越小,電池電量的穩(wěn)定性越好。從圖5(a)的仿真結果可以看到,在V<40時,保密速率隨著V的增大而提高,而電池電量的標準差增大(意味著電池電量的波動增大),與設計時的預期相符。V增大,優(yōu)化時更偏重于保密速率最大化,而電池電量的穩(wěn)定性會降低。但V 增大到40以后,V繼續(xù)增大時系統(tǒng)平均速率反而下降。這是因為V過大時,優(yōu)化過程中過度關注最大化保密速率,傾向于使用更高的發(fā)送功率,導致電池存儲的電量水平有較大的波動,且平均電量減少,如圖6所示,出現在信道條件較好時有沒有足夠的電量支持更高信息傳輸速率的概率增大,從而導致平均保密速率反而有所下降。在V保持不變時,U增大時系統(tǒng)更加關注縮小兩個目的節(jié)點的數據隊列差,因此數據隊列長度差均方根值減小,但相應保密傳輸性能會略有下降。
圖5 權重V,U對系統(tǒng)性能的影響
圖6 電池電量與權重V的關系,U=10
本文針對能量收集中繼安全通信系統(tǒng),對提高系統(tǒng)保密傳輸能量效率的在線功率控制算法進行研究。源和中繼節(jié)點發(fā)送信號的能量來自收集的能量??紤]兩個目的節(jié)點間信息需要相互保密的場景,聯(lián)合控制源節(jié)點和中繼節(jié)點的發(fā)送功率,在能量收集和電池使用約束下最大化長期時間平均保密速率。采用Lyapunov優(yōu)化框架,將長期時間平均保密速率的優(yōu)化問題轉化為每個時隙的優(yōu)化問題,而將能量收集和使用的約束轉化為虛隊列的穩(wěn)定要求。優(yōu)化目標作為懲罰項,將原優(yōu)化問題轉換為每時隙的“虛隊列漂移加懲罰”最小化問題。同時,為適應兩目的節(jié)點傳輸數據量需求的變化,增加了一個根據數據隊列長度差對權重進行調整的調節(jié)項。進一步將優(yōu)化問題簡化為最小化該上界。在時變衰落信道下對算法的性能進行了仿真,仿真結果表明,本文所提算法性能明顯優(yōu)于貪婪算法、半功率算法和隨機功率算法,僅略低于最優(yōu)的離線注水算法。本文所提算法僅依賴于當前電池的狀態(tài)和信道狀態(tài),是一種低復雜度的、易于實用的算法。