李永成,周小猛,高貞貞,3,白少壯,李康澤
(1.電子信息系統復雜電磁環(huán)境效應國家重點實驗室,471003,河南洛陽;2.西安交通大學信息與通信工程學院,710049,西安;3.東南大學移動通信國家重點實驗室,210096,南京)
由于無線通信具有廣播特性使其易遭受干擾攻擊,因此抗干擾技術的研究顯得日益重要。在無線抗干擾技術的研究中,已有的研究方向主要是針對空間域、頻域或者功率域。應用于衛(wèi)星通信的空間域抗干擾技術[1-3]通常有空間隔離法、頻率隔離法、信號處理法(擴頻和跳頻等)等抗干擾方案;頻域的主要抗干擾技術[4-5]是擴頻技術,它包括跳頻技術[6]、直接序列擴頻技術[7]及自適應擴頻技術[8];功率域的抗干擾技術被認為是最直接有效也是使用最廣的抗干擾方案,主要通過改變通信方與干擾機的發(fā)射功率來實現[9-11]。
近年來,從很多人為干擾案例可以看出通信與干擾都在向著智能化發(fā)展。博弈論可以滿足通信方與干擾機進行智能化決策的需求[12-13]。例如,文獻[14]提出了一種零和博弈模型,用來分析用戶和干擾者之間的關系。針對通信方與干擾機之間的主從對抗特征,已有文獻表明Stackelberg博弈模型非常適用于該場景。文獻[6]研究了時間域的抗干擾策略,通過Stackelberg博弈模型找到通信方跳頻的最優(yōu)跳速,并在求解過程中考慮了觀測誤差造成的影響。文獻[9]的作者主要研究功率域抗干擾系統,在不完全信息場景下建立Stackelberg博弈模型。文獻[10]的作者梳理了各種不同情況下的無線通信抗干擾技術。文獻[11]的作者主要研究了無人機通信中的抗干擾問題,考慮了觀測誤差和信息的不確定性。
前述工作主要針對點對點通信系統研究了基于單域的抗干擾技術。隨著中繼的引入,無線通信系統應用場景進一步擴展,中繼可以有效地幫助用戶提高通信質量。針對譯碼轉發(fā)中繼輔助抗干擾通信系統,文獻[15]的作者將中繼節(jié)點作為Stackelberg博弈的副領導者,建立了3層Stackelberg博弈模型。針對放大轉發(fā)中繼系統,文獻[16]的作者提出了一種基于跳頻的多域抗干擾策略,使用Stackelberg博弈來模擬通信方和干擾者之間的交互作用,但是該工作只適用于博弈雙方能夠獲得彼此完美信息的理想情況。
基于已有研究工作基礎,本文針對存在不確定信道信息和參數估計誤差的非理想情況,在放大轉發(fā)中繼系統中提出了基于Stackelberg博弈的聯合時間域和功率域的抗干擾方案。本文的博弈模型將源和中繼作為領導者,干擾機作為跟隨者,建立雙層的Stackelberg博弈模型,然后用逆向歸納法求解通信方和干擾機的最優(yōu)多域參數。仿真結果表明,本文所提多域抗干擾方案相比于已有單域方案和多域隨機方案具有顯著的性能優(yōu)勢。
考慮一個兩跳的無線中繼系統,系統模型如圖1所示。該系統由一個源節(jié)點S、一個目的節(jié)點D、一個可信中繼節(jié)點R和一個干擾節(jié)點(干擾機)J組成,中繼采用放大轉發(fā)協議,工作在半雙工模式。由于障礙物的遮擋,源節(jié)點和目的節(jié)點之間沒有直接鏈路。源到目的節(jié)點的傳輸分為兩個階段:階段1,源節(jié)點以功率PS向中繼發(fā)送信號;階段2,中繼對接收信號能量歸一化并用功率PR進行信號轉發(fā)。干擾機在檢測到信號后會對源和中繼進行干擾。用hSR、hRD、hJR、hJD來分別表示S與R、R與D、J與R以及J與D之間的信道。在D處受干擾的接收信號可以表示為[17]
圖1 兩跳無線中繼系統模型Fig.1 System model of two-hop wireless relay
y=hRDη(hSRs+hJRsJ1+nR)+hJDsJ2+nD
(1)
式中:s表示信源S發(fā)出的信號,發(fā)射功率為PS;sJ1表示J發(fā)送到R并且功率為PJ1的零均值高斯干擾信號;sJ2表示J發(fā)送到D且功率為PJ2的零均值高斯干擾信號;nR表示R處方差為NR的零均值高斯噪聲;nD表示D處方差為ND的零均值高斯噪聲;η表示中繼的放大轉發(fā)因子,可以用下式來表示
(2)
假設源節(jié)點和中繼的最大發(fā)射功率分別為PS,max和PR,max,則PS≤PS,max,PR≤PR,max。對于干擾機,假設其最大總功率為PJ,則PJ1+PJ2=PJ,功率分配系數為ρ=PJ1/PJ。
典型的跳頻信號結構示意圖如圖2所示。干擾機采用引導式跟蹤干擾的干擾策略:在每個跳頻周期內,干擾機首先檢測跳頻信號,若檢測到跳頻通信信號,則立即引導干擾機進行干擾;否則,干擾機不發(fā)射干擾信號。將每個跳頻周期T表示成兩部分:信號檢測時間TE和干擾時間TI,即T=TE+TI,其中T∈[0,Tmax],Tmax為最大跳頻周期。假設T1為階段1和階段2的持續(xù)時間,且T=nT1,其中n為正整數。此外,將TI表示為TI=mT1,m 圖2 跳頻信號結構示意圖Fig.2 Structure diagram of frequency hopping signal 跳頻信號在M個相鄰但不相交的子頻帶內偽隨機跳變。通信方包括源和中繼能夠根據引導式跟蹤干擾的參數,在滿足最大跳頻周期的范圍內自適應調整跳頻周期。從圖2可見,干擾機檢測時間越長,它能正確跟蹤通信方信號的概率就越高,但是剩下用來干擾的時間就會越短。通信方能夠根據干擾機的情況自適應改變跳頻周期以最大化自己的利益,故干擾機的檢測時間和通信方的跳頻周期對通信方的性能有著重要的影響。因此,本文將時間域和功率域聯合考慮,求解能最大化通信方效用函數的時間域和功率域參數。 由于信號檢測概率往往與檢測時間或信號發(fā)射功率有關,用pd表示跳頻通信信號的檢測概率,根據文獻[19],pd可表示為 (3) 式中:γJ表示干擾機J處的接收信噪比。 已有工作通常假設通信方具有干擾機的完美信道狀態(tài)信息,并依此來確定其最佳策略,這在實際情況下往往是不可行的。為了建模更實際的情況,本文考慮如下的非理想情況:通信方只能獲得干擾信道的不確定信道信息,且干擾機和通信方對功率域及時間域參數的估計存在誤差。 考慮到信道信息的不確定性,通信方沒有干擾機信道增益的完美信息,但是根據文獻[9],可以如假設1所示,通信方能夠獲取他們的概率分布。此外,如假設2所示,干擾機和通信方對對方參數的估計存在估計誤差。 假設1對于通信方而言,只能獲得干擾機到通信系統的不確定信道信息,假設干擾機到中繼和目的節(jié)點的信道增益分別為gJR,gJD,它們分別有B和K種狀態(tài),表示為βJR,b,b=1,…,B和βJD,k,k=1,…,K。其概率分布分別為φR(βJR,b)和φD(βJD,k),則有 (4) 1.3.1 通信方效用函數 考慮到實際無線設備電池容量有限的能量限制,建立通信方的效用函數時,在衡量通信關鍵指標的同時也要考慮發(fā)射代價。除此之外,由于考慮了不確定信道信息和參數估計誤差,我們需要對不同干擾機信道增益下的接收機的平均信干噪比依概率求和,因此將通信方的效用值定義為 CSPS-CRPR (5) (6) 由信噪比的定義得到式(6)中γD為[16] (7) 式中:gSR=κ[d0/dSR]α和dSR分別是S到R信道的增益和距離,κ是由天線特性和平均信道損耗所決定的常系數,d0是天線遠場的參考距離,α是路徑損耗因子;gRD=κ[d0/dRD]α和dRD分別是R到D的信道增益和距離??紤]到非理想情況,式(6)中的ΓD應寫為 (8) 根據[16],通信方估計J的接收信噪比為 (9) 式中:NJ是J處的零均值高斯噪聲的方差。 (10) 1.3.2 干擾機效用函數 考慮干擾機由電網供能,這對于合法通信系統來說是最壞情況。與電池供能設備相比,干擾機的發(fā)射代價可以忽略不計。因此考慮估計誤差后,干擾機的效用函數表示為 (11) (12) (13) (14) 式中:Le3=[ND+(1-ρ)PJgJD];Le2=[NR+ρPJgJR]。 (15) (16) 1.3.3 基于效用函數的優(yōu)化模型 根據上述效用函數,通信方和干擾機的目標是使各自的效用值最大化。根據跳頻信號的檢測結果,作為跟隨者的干擾機從以下優(yōu)化問題中確定最佳檢測時間TE和功率分配系數ρ (17) 而作為領導者,信源和中繼從以下優(yōu)化問題中確定最佳發(fā)射功率和跳頻周期 (18) 本節(jié)將采用逆向歸納法對建立的Stackelberg博弈模型進行求解。求解時,干擾機作為跟隨者根據跳頻信號的檢測結果求解其最優(yōu)檢測時間和干擾功率分配因子,并推導出最優(yōu)近似閉式解。通信方作為領導者使用基于遺傳算法(GA)的優(yōu)化方案求解其功率域和時域參數。 干擾機作為跟隨者可以根據檢測到的跳頻信號估計通信方參數,下面將在給定通信方參數下求解最優(yōu)干擾機參數。 (19) 根據文獻[16],可求得閉式解為 ρ*=min(1,max(0,ρ0)) (20) 式中,ρ0所代表的多項式如下 (21) 2.1.2 最優(yōu)信號檢測時間 在獲得最優(yōu)功率分配系數后,可得到信號檢測時間的最優(yōu)值。根據文獻[16]已經證明的結論,公式(17)可以被簡化為以下等式 (22) 其中m*的表達如下 (23) (24) 式中,μ的表達式為 (25) 以信源和中繼為領導著來優(yōu)化PS、PR、T。采用一種基于質數分布的遺傳算法(GAED)[20]來解決這一非線性雙層規(guī)劃問題。 2.2.2 適應度計算 對于第t代的個體,適應度函數由下式表示 (26) 式中:η表示一個充分大的正數。適應度函數后兩項的存在,使得算法能夠在迭代過程中讓含有異常值的個體獲得很低的適應度值,并在之后的迭代過程中淘汰這部分個體。 完成第t代所有個體的適應度值計算后,記錄適應度最好個體為I*t=(L*t,G*t)和從t-1代遺傳的所有可能個體中具有最大通信方的效用值的個體I′t=(L′t,G′t)。 (27) 式中:μ∈[0,τ],其中τ是限制因子,避免交叉過后的個體的參數在約束集之外;Qt是提供交叉方向的向量,并且基于L*t和L′t進行優(yōu)化。 選擇合適的Qt十分重要,因為L*t是第t代種群中適應度最好個體的通信方參數,我們希望Qt能以更高的概率接近L*t,因此本文選擇了基于指數分布的選擇法。假設F服從指數分布,則有 (28) (29) 2.2.5 選擇 從第t代所有個體、集合O1和集合O2之中選擇適應度值最高的Pn個個體作為下一代種群的一部分個體,其中Pn 本文主要仿真參數的設置參照了相關文獻[6,15-16]對類似場景的仿真參數設置,設置如下:令單時隙通信周期T1為1 ms,頻率切換時間T0為0.5 ms,最大跳頻周期為100 ms;干擾機的發(fā)射功率為PJ=10 W;信源和中繼的最大功率限制設置為PS,max=PR,max=1 W;噪聲功率NJ=NR=ND=-50 dBm;可選信道數M為32。仿真采用室外場景,信源、接收機、干擾機和中繼的位置坐標設置為[-4,0]、[2,0]、[0,3]及[-1,0]km;信道參數設置為κ=1,d0=0.1 km,α=3。仿真中初始種群數l為30;交叉概率pc和變異概率pm分別為0.8和0.2;信源和中繼的發(fā)射功率代價因子設為CS=CR=0.8。 為了衡量不確定信道信息、功率及時間域參數估計誤差對效用值的影響,我們定義了通信方和干擾機的實際效用值,即通信方和干擾機在不確定信道信息和參數估計誤差的情況下進行抗干擾決策,將決策結果運用于干擾機當前真實信道及功率分配,以及通信方真實發(fā)射功率和跳頻周期的情況下,計算通信方和干擾機的實際效用值,因此通信方的實際效用值可寫為 (30) 圖3為干擾機對參數T的估計誤差對效用值的影響圖,可以看到εT越大,通信方效用值越大,干擾機效用值越小。這是因為當干擾機對通信方參數存在估計誤差會導致自己的參數偏離最優(yōu)值,使得干擾機效用值下降,通信方效用值增大。 圖3 時間域估計誤差對效用值的影響Fig.3 Effect of estimation error in time domain on utility value 圖4為干擾機對發(fā)射機功率參數的估計誤差對效用值的影響圖,令εP=εPS=εPR??梢钥闯?εP越大,通信方效用值越大。同樣因為干擾機估計誤差越大,干擾機的觀察結果與實際值之間的偏差就越大,這會影響干擾機的決策并降低干擾機效用值和增加通信方效用值。 圖4 功率域估計誤差對效用值的影響Fig.4 Effect of estimation error in power domain on utility value 圖5考察了不確定信道信息對效用值的影響,我們在不同的概率分布下進行了通信方實際效用值仿真。在圖5的3種概率分布中,當φR(βJR,1)=0.5、φR(βJR,2)=0.5時,對于干擾信道狀態(tài)的不確定度最大;φR(βJR,1)=0.9、φR(βJR,2)=0.1時,對信道狀態(tài)的不確定度最小。由圖5可得,當信道的不確定度增加時,由于通信方不能精確進行優(yōu)化而導致通信方效用值下降。 圖5 不確定信道信息對效用值的影響 Fig.5 Effect of incomplete channel information on utility value 假設J到R的信道增益有兩個狀態(tài)[βJR,1,βJR,2]=[0.2,0.3],干擾節(jié)點J到接收機D的信道增益也有兩種狀態(tài)[βJD,1,βJD,2]=[0.3,0.6],其分布概率為φR(βJR,1)=φR(βJR,2)=φD(βJD,1)=φD(βJD,2)=0.5。對于通信方和干擾機的估計誤差,我們設置εT=εTE=εPS=εPR=0.2,ερ=0.02。 圖6展示了本文所提多域博弈方案與單域博弈方案和多域隨機方案的效用值對比。單域博弈方案包括單時域和單功率域,其中,在單時域方案中隨機選擇功率(PS,PR),通過遍歷獲得最優(yōu)跳頻周期T,最后用上文推導出的閉式解來選擇最優(yōu)信號檢測周期TE和功率分配ρ。而單功率域方案則是相反,即盲跳頻隨機選擇跳頻周期T,遍歷獲得最優(yōu)(PS,PR)。多域隨機方案則隨機選擇時域和功率域參數。通過分析圖6的仿真結果,可以發(fā)現多域隨機方案具有最小的通信方效用值,而本文所提方案具有最大的通信方效用值。單域博弈方案中,單功率域方案能取得較高的通信方效用函數值,隨著發(fā)射代價的增大,單功率域方案與本文方案的差距逐漸減小。當發(fā)射代價為CS=CR=0.7時,本文方案通信方效用值為27.43,單功率域方案通信方效用值為13.22,本文方案的通信方效用值相比于單功率域方案提高約100%,當發(fā)射代價為CS=CR=0.8時,本文方案通信方效用值為7.56,單功率域方案通信方效用值為3.36,本文方案的通信方效用值相比于單功率域方案提高約50%。與此同時,本文方案取得了最小的干擾機效用值。當發(fā)射代價為CS=CR=0.7時,本文方案的干擾機效用值約為-165,單功率域方案的干擾機效用值約為-100,本文方案的干擾機效用值相比于單功率域方案至少惡化了50%。 圖6 本文方案與對比方案的效用值對比Fig.6 Comparison of utility value between the proposed scheme and the comparative schemes 本文針對存在惡意干擾機的放大轉發(fā)中繼系統提出了一種多域抗干擾方案。該方案使用Stackelberg博弈來建模通信方和干擾者之間的交互作用,并考慮了實際情況下對抗雙方信息獲取困難的問題,對不確定信道信息和功率域及時間域參數估計誤差進行了建模,采用逆向歸納法對博弈雙方的時域和功率域參數進行了求解。通過仿真討論了參數估計誤差和不確定信道信息對于通信方和干擾機效用值的影響,并證明了本文所提多域博弈方案相較于單域博弈方案和多域隨機方案的優(yōu)勢。1.2 非理想情況
1.3 Stackelberg博弈模型建立
2 基于多域的博弈抗干擾方案
2.1 跟隨者干擾機的子博弈
2.2 領導者通信方的子博弈
3 仿真結果分析
3.1 估計誤差對效用值的影響
3.2 不確定信道信息對效用值的影響
3.3 與不同方案的對比
4 結 論