鄧 旭,朱立東
(電子科技大學(xué) 通信抗干擾技術(shù)國家級重點實驗室,四川 成都611731)
隨著無線通信技術(shù)的發(fā)展,人們對衛(wèi)星提供高速率、低時延、大容量的多媒體業(yè)務(wù)提出了更高要求。對衛(wèi)星通信系統(tǒng)而言,無線資源管理與分配的關(guān)注點在多用戶分布和多業(yè)務(wù)分配不均的情況下,如何解決資源共享,如何提高衛(wèi)星通信系統(tǒng)的資源利用率,如何使衛(wèi)星通信系統(tǒng)擁有更好的性能成為人們亟待解決的問題[1]。傳統(tǒng)資源分配技術(shù)已難以滿足人們?nèi)找嬖鲩L的多媒體業(yè)務(wù)服務(wù)質(zhì)量需求,原因在于該技術(shù)在新呼叫阻塞率和切換呼叫失敗率之間進(jìn)行權(quán)衡考慮,一方面失敗率的降低意味著另一方面失敗率的提高。因此,針對多用戶場景下衛(wèi)星通信網(wǎng)絡(luò)資源分配問題,提出匹配博弈新策略,力求滿足多業(yè)務(wù)的服務(wù)質(zhì)量要求。
有關(guān)信道分配資源算法的研究除了傳統(tǒng)波束信道分配策略外,現(xiàn)有的算法研究有凸優(yōu)化算法[2]、貪心算法[3]和基于博弈論的算法[4]。基于博弈論的算法運用比較廣泛,其中包含非合作博弈和匹配博弈算法等。在解決資源分配問題方面,SONG L提出了非合作博弈算法,該算法雖然能有效解決資源分配問題,但是資源匹配單邊不穩(wěn)定[5],所以有關(guān)信道資源分配算法的研究,本文把重點放在以匹配為基礎(chǔ)的雙邊穩(wěn)定博弈算法。
匹配博弈的最初目的是為了解決市場因缺乏穩(wěn)定而失靈的問題,通過匹配即市場間交換的本質(zhì),使雙方經(jīng)濟(jì)效益達(dá)到最大化。匹配博弈根據(jù)匹配關(guān)系,可以將其分成一對一[6]、多對一[6-7]、多對多匹配[8]關(guān)系。2012年匹配理論的創(chuàng)立者Alvin E.Roth[9]憑借這一貢獻(xiàn)獲得諾貝爾經(jīng)濟(jì)學(xué)獎。隨著匹配博弈理論的發(fā)展,該算法思想不再局限于經(jīng)濟(jì)學(xué)領(lǐng)域,越來越多的研究者將其運用到無線通信領(lǐng)域來解決無線資源分配問題。
ZHOU Z Y等人基于D2D通信資源分配問題,結(jié)合多對一的匹配博弈算法,采用迭代方法對頻譜和功率進(jìn)行聯(lián)合分配,數(shù)值結(jié)果驗證了該算法在各種仿真場景下的有效性和優(yōu)越性[10]。ZHAO J將提高系統(tǒng)吞吐量作為研究對象,提出多對多匹配博弈用以解決D2D的資源分配算法,該算法表明在有限的迭代次數(shù)范圍內(nèi)可以收斂到雙邊交換穩(wěn)定匹配,并加以證明該算法性能明顯優(yōu)于一對一匹配算法[11]。此外,姚天等人就如何實現(xiàn)用戶與網(wǎng)絡(luò)資源間有效匹配問題上充分考慮用戶公平性,采用多對多和多對一雙層匹配博弈加以求解,通過引入隨機(jī)匹配和最優(yōu)化匹配對比,驗證該算法具有良好的收斂性、有效性和可行性[12]。時國維等人提出2層多對一匹配博弈算法,經(jīng)研究結(jié)果表明該算法能使資源匹配變穩(wěn)定,有效解決存儲系統(tǒng)中的資源分配問題,并有效降低系統(tǒng)時延。為了進(jìn)一步優(yōu)化資源分配問題,提出了3層多對多的資源分配方案,經(jīng)仿真結(jié)果表明,該算法能實現(xiàn)傳輸延遲最小化和社會效益最大化[13]。
多層資源分配網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。假設(shè)存在I個MEO衛(wèi)星,J個LEO衛(wèi)星,P個基站數(shù)以及平均每個基站有Q個用戶數(shù)。M={M1,M2,…,MI}表示I個MEO衛(wèi)星集合,L={L1,L2,…,LJ}表示J個LEO衛(wèi)星集合,B={B1,B2,…,BP}表示P個基站數(shù)集合。
匹配過程分為3個階段:第1階段為MEO衛(wèi)星層與LEO衛(wèi)星層之間星間鏈路的建立。LEO/MEO雙層衛(wèi)星網(wǎng)絡(luò)系統(tǒng)可發(fā)揮LEO衛(wèi)星傳輸時延短及損耗小等特點[14-15],簡化LEO衛(wèi)星結(jié)構(gòu)以及降低其建設(shè)成本;同時在衛(wèi)星網(wǎng)絡(luò)中起到傳輸、轉(zhuǎn)發(fā)和管理功能的MEO衛(wèi)星結(jié)構(gòu)簡單,有利于簡化路由設(shè)置,減少信息開銷和信息交換時延等功能,通過將LEO/MEO衛(wèi)星之間的優(yōu)勢互補可實現(xiàn)天基網(wǎng)發(fā)展的一種理想組網(wǎng)模式[16]。除了不同軌道間星間鏈路建立,還要在同軌道進(jìn)行鏈路建立,通過建立好的星間鏈路實現(xiàn)衛(wèi)星與衛(wèi)星之間的信息數(shù)據(jù)交互。第2階段為衛(wèi)星與地面基站的星地鏈路建立。衛(wèi)星與地面網(wǎng)絡(luò)可以看作一個整體,它們通過星地激光鏈路相互連接,在此過程不僅可發(fā)揮衛(wèi)星覆蓋面積廣、大容量通信等特點,還可發(fā)揮地面光通信速率快、可靠性高等特點,它們之間互為補充可增強整個網(wǎng)絡(luò)的生存能力[17-18]。第3階段為基站與用戶之間的匹配問題。由于基站與基站之間的覆蓋面積有重疊區(qū)域,而且每個基站覆蓋的大小和用戶分布都不均勻,為了簡便該層匹配模型,將所有基站看成是一個大的資源池,所有用戶對資源池里的資源塊進(jìn)行使用,在一定程度上可對其分配模型進(jìn)行簡化。
圖1 網(wǎng)絡(luò)匹配模型
在該系統(tǒng)模型構(gòu)建下主要解決3個問題。第1個問題是不同軌道之間星間鏈路的建立;第2個問題是衛(wèi)星與地面基站星地鏈路的建立;第3個問題是基站與用戶之間的資源匹配。3層匹配之間相互聯(lián)系,前面的匹配博弈結(jié)果將影響后邊的匹配決策判斷,匹配框架如圖2所示。
圖2 匹配框架
在星間鏈路中電波傳播主要考慮自由空間傳播的影響,由于不存在大氣層等其他附加損耗的影響,相對應(yīng)的自由空間傳播損耗公式為:
LMEO-LEO=92.44+20lgd+20lgf,
(1)
式中,d為MEO衛(wèi)星和LEO衛(wèi)星之間的距離,單位km,f為衛(wèi)星的工作頻段,單位GHz,LMEO-LEO表示MEO衛(wèi)星與LEO衛(wèi)星之間的自由空間傳播損耗。
由此得知MEO衛(wèi)星與LEO衛(wèi)星之間的信道增益可表示為:
GMEO-LEO=10-(LMEO-LEO/10)。
(2)
星地鏈路傳播損耗除了自由空間傳播損耗外,還存在其他附加損耗。對于自由空間損耗與式(1)類似,則星地鏈路傳播損耗公式為:
LLEO-BS=92.44+20lgd+20lgf+Lrest,
(3)
式中,Lrest包括雨衰及大氣層吸收等附加損耗。則星地鏈路間的信道增益為:
GLEO-BS=10-(LLEO-BS/10)。
(4)
對于基站與用戶之間的鏈路連接問題,可將鏈路損耗視為服從高斯分布,其概率密度函數(shù)服從瑞利分布[9],則基站與用戶之間的鏈路增益可表示為:
GBS-MS=βd-η|h|2,
(5)
式中,β為信道參數(shù),d為用戶與基站間的距離,η為路徑衰落指數(shù),而h遵循h(huán)~CN(0,1)的復(fù)高斯信道參數(shù)。
多對多匹配模型下每個MEO衛(wèi)星能與多個LEO衛(wèi)星建立鏈路連接,假設(shè)每個MEO衛(wèi)星平均發(fā)射總功率為Q,則第i個MEO衛(wèi)星在鏈路建立上平均分配其功率為:
(6)
同理,每個LEO衛(wèi)星也可以與多個MEO衛(wèi)星建立鏈路連接,則第j個LEO衛(wèi)星在鏈路建立上平均分配功率可表示為:
(7)
結(jié)合式(6)和式(7),分別得到LEO衛(wèi)星和MEO衛(wèi)星接收到的信噪比γi,γji為:
(8)
(9)
式中,Gij為第i個MEO衛(wèi)星到第j個LEO衛(wèi)星的增益,Gji為第j個LEO衛(wèi)星到第i個MEO衛(wèi)星的增益。為了方便計算,假設(shè)Gij=Gji。此外,N0表示接收端的噪聲功率,可表示為:
N0=-228+10lgT+10lgBMEO-LEO,
(10)
式中,BMEO-LEO為MEO衛(wèi)星和LEO衛(wèi)星之間的傳輸帶寬,T為接收機(jī)的等效噪聲溫度。
結(jié)合式(8)和式(9),第i個MEO衛(wèi)星和第j個LEO衛(wèi)星的傳輸速率為:
ri=BMEO-LEOlb(1+γi),
(11)
rji=BMEO-LEOlb(1+γji)。
(12)
在匹配博弈中,為了評估參與對象博弈匹配中的整體滿意度,需要在特定模型和特定應(yīng)用下設(shè)計合理的效用函數(shù)來反映其滿意程度,用U1表示MEO衛(wèi)星層與LEO衛(wèi)星層之間的系統(tǒng)總體效用值,通過MEO衛(wèi)星與LEO衛(wèi)星總的吞吐量對其進(jìn)行描述。其相關(guān)定義如下:
(13)
此外,對于上述公式存在一些限定條件,相關(guān)定義如下:
xijγji≥xijγjimin?i,j,
(14)
γi≥γimin?i,
(15)
xij∈{0,1} ?i,j∈{1,2,…,J},
(16)
(17)
(18)
式(14)和式(15)中,γjimin,γimin表明MEO衛(wèi)星與LEO衛(wèi)星所接收到的最小信噪比,且在接收過程中信噪比不能低于最小信噪比,否則星間鏈路建立失敗;式(16)表明,xij只能取0或1;式(17)表明對于任意LEO衛(wèi)星最多只能與pmax個MEO衛(wèi)星進(jìn)行鏈路連接,式(18)表明對于任意MEO衛(wèi)星最多只能連接qmax個LEO衛(wèi)星,若超過則選擇偏好列表前qmax個衛(wèi)星進(jìn)行連接。第2層和第3層的效用值U2,U3求法與第1層求法類似,可求得3層匹配模型下的最優(yōu)效用值為:
Uall=U1+U2+U3。
(19)
匹配博弈通常涉及到2個集合間的匹配關(guān)系問題,在所提匹配博弈中MEO衛(wèi)星、LEO衛(wèi)星、基站和用戶被看作是參與匹配博弈的4種不同參與者,并假設(shè)四者之間相互獨立。
在第1層匹配博弈中,MEO衛(wèi)星和LEO衛(wèi)星被看作是雙方參與者,數(shù)據(jù)業(yè)務(wù)的傳輸需要在二者之間建立星間鏈路,每顆MEO衛(wèi)星不僅能與多顆LEO衛(wèi)星建立星間鏈路連接,而且每顆LEO衛(wèi)星也能建立多條鏈路與MEO衛(wèi)星連接,因此該匹配模型可看作是多對多匹配。
μ1是集合M∪L到集合2M∪L的映射,對于?Mi∈M,Lj∈L有:
① |μ1(Mi)|={L1,L2,…,Lj},|μ1(Mi)|≤J,并且當(dāng)μ1(Mi)?L時,μ1(Mi)=Mi;
② |μ1(Lj)|={M1,M2,…,Mi},|μ(Lj)|≤I,并且當(dāng)μ1(Lj)?M時,μ1(Lj)=Lj;
③ 當(dāng)且僅當(dāng)μ1(Mi)=Lj時,μ(Lj)=Mi。
條件①表示Mi衛(wèi)星可以和一個或多個LEO衛(wèi)星進(jìn)行鏈路連接,并規(guī)定Mi衛(wèi)星最大鏈路連接不能超過LEO衛(wèi)星總數(shù),若μ1(Mi)=Mi則表示Mi衛(wèi)星沒有鏈路連接;同理條件②表示Lj衛(wèi)星可以和一個或多個MEO衛(wèi)星進(jìn)行鏈路連接,Lj衛(wèi)星最大連接數(shù)不大于MEO衛(wèi)星總數(shù),若μ1(Lj)=Lj,則Lj衛(wèi)星沒有鏈路連接;條件③表示當(dāng)Mi衛(wèi)星和Lj衛(wèi)星的雙向選擇。
在第2層匹配博弈中,匹配雙方參與者為LEO衛(wèi)星和BS基站。與第1層匹配類似,該層匹配雙方之間的偏好列表根據(jù)傳輸環(huán)境及空地間距等綜合考慮。每顆LEO衛(wèi)星可以與多個基站進(jìn)行星地鏈路連接后傳輸業(yè)務(wù)數(shù)據(jù),而每個基站轉(zhuǎn)發(fā)數(shù)據(jù)信息到多顆衛(wèi)星上,因此該層匹配也可視為多對多匹配模型,與第1層定義類似,這里不做重復(fù)介紹。
在第3層匹配博弈中,將所有基站中總信道資源視為一個資源池,用戶對資源池中的資源塊進(jìn)行使用。每個用戶可以和一個或多個資源塊進(jìn)行連接,但是一個資源塊在同一時刻只能被一個用戶使用,因此該匹配模型為多對一匹配。μ3是集合RB∪MU到集合2RB∪MU的映射,對于?RBr∈RB,MUk∈MU,滿足下列條件:
① |μ(RBr)|={MU1,MU2,…,MUk},|μ(RBr)|≤1,并且當(dāng)μ(RBr)?MU時,μ(RBr)=RBr;
② |μ(MUk)|={RB1,RB2,…RBr},|μ(MUk)|≤K,并且當(dāng)μ(MUr)?RB時,μ(MUk)=MUk;
③ 當(dāng)且僅當(dāng)μ(RBr)=MUk時,μ(MUk)=RBr。
條件①表示一個資源塊最多只能被一個用戶使用,若μ(RBr)?MU則表示該資源塊沒有匹配對象;條件②表示一個用戶可以和一個或多個資源塊進(jìn)行連接使用,并且規(guī)定一個用戶最大使用資源塊數(shù)不能超過總資源塊數(shù);條件③表明RBr,MUk之間的雙向匹配。
根據(jù)MEO衛(wèi)星與LEO衛(wèi)星之間的多對多匹配關(guān)系建立相應(yīng)的匹配博弈算法,如算法1所示。在開始階段輸入βj,βi偏好列表,并限定每顆MEO衛(wèi)星的配額為QL,每顆LEO衛(wèi)星的配額為QM。MEO衛(wèi)星根據(jù)自己的偏好程度給LEO發(fā)送連接請求,然后LEO衛(wèi)星根據(jù)自己的偏好列表選擇前QM顆MEO衛(wèi)星相連接并拒絕其他請求。如果此時MEO衛(wèi)星還有多余的連接空間,則將繼續(xù)留在Θ1中,否則將從Θ1中刪除并計算當(dāng)前的U1效用值。最后依次循環(huán)直到未匹配集合Θ1為空。第2層和第3層算法思想與第1層類似,這里不做重復(fù)介紹。
算法1 第1層多對多匹配算法
輸入:MEO衛(wèi)星的偏好列表βj,配額QL;LEO衛(wèi)星的偏好列表βi,配額QM。
輸出:穩(wěn)定匹配μ1和效用值U1。
1:創(chuàng)建MEO衛(wèi)星未匹配集合Θ1={M1,M2,…,Mi};
2:whileΘ1≠? do
3: for allMi∈Θ1do
4: 根據(jù)偏好列表βj向LEO衛(wèi)星發(fā)送鏈路連接請求,并使xij=1;
5: 將βj中的最偏好元素移除;
6: end for
7: for allLj∈Ldo
8: if∑i=1xij>QM
9: 根據(jù)βi選擇QM個最偏好的MEO衛(wèi)星建立連接,拒絕其他請求;
10: 被拒絕的MEO衛(wèi)星的xij=0;
11: else
12: 與當(dāng)前的MEO衛(wèi)星建立鏈路連接;
13: end if
14: end for
15: for allMi∈Θ1do
16: if∑j=1xij>QL
17: 將Θ1中的Mi移除
18: end if
19: end for
20:計算當(dāng)前U1效用值;
21:end while
為了驗證3層多對多匹配博弈算法的有效性,通過Matlab對其進(jìn)行仿真,具體參數(shù)如表1所示。
表1 系統(tǒng)仿真參數(shù)
參數(shù)取值MEO高度/km10 355星間最大發(fā)射功率/W27星間鏈路ISL頻段/GHz 30星間鏈路帶寬/MHz 100星間鏈路接收發(fā)射天線總增益/dB68MEO最大復(fù)用數(shù)2LEO高度/km1 414LEO最大發(fā)射功率/W19.95LEO頻段/GHz14.5星地鏈路帶寬/MHz32星地鏈路接收發(fā)射天線總增益/dB19.5LEO最大復(fù)用數(shù)2星地鏈路附加損耗Lrest/dB2基站帶寬/MHz10基站最大發(fā)送功率/dBm23基站最大復(fù)用數(shù)2小區(qū)半徑/m500路徑衰減指數(shù)α4路徑衰減常數(shù)β0.02用戶接收端噪聲功率N0/dB-134用戶最大復(fù)用數(shù)2最大迭代次數(shù)30地面接收發(fā)射天線總增益/dB17.5
圖3表示LEO衛(wèi)星個數(shù)為6、基站個數(shù)為10、平均每個基站用戶數(shù)為20時系統(tǒng)總體效用值QoE隨MEO衛(wèi)星個數(shù)不同而變化的曲線;圖4表示MEO衛(wèi)星個數(shù)為3、基站個數(shù)為10、平均每個基站用戶數(shù)為20時系統(tǒng)總體效用值QoE隨LEO衛(wèi)星個數(shù)不同而變化的曲線;圖5表示MEO衛(wèi)星個數(shù)為3、LEO衛(wèi)星個數(shù)為6、平均每個基站用戶數(shù)為20時系統(tǒng)總體效用值QoE隨基站個數(shù)不同而變化的曲線。
由圖3~圖5可以看出,隨著MEO衛(wèi)星、LEO衛(wèi)星或是基站個數(shù)的增加,系統(tǒng)的總體效用值都在逐步增加,這是因為個數(shù)的增多會使其他參與者獲得更多的分集增益,并且有更多的機(jī)會成功參與到資源分配當(dāng)中,從而提高系統(tǒng)總的吞吐量,與理論分析一致。隨著迭代次數(shù)的增加,3條曲線呈不斷上升的趨勢,并最終趨于穩(wěn)定,證明了匹配博弈的有效性及穩(wěn)定性。
圖3 QoE隨MEO衛(wèi)星個數(shù)變化
圖4 QoE隨LEO衛(wèi)星個數(shù)變化
圖5 QoE隨基站個數(shù)變化
圖6表示MEO衛(wèi)星個數(shù)為4、基站個數(shù)為10、平均每個基站用戶數(shù)為20時3種匹配博弈算法的系統(tǒng)總體效用值QoE隨LEO衛(wèi)星個數(shù)的變化曲線。圖7表示MEO衛(wèi)星個數(shù)為3、LEO衛(wèi)星個數(shù)為4、平均每個基站用戶數(shù)為20時3種匹配博弈算法系統(tǒng)總體效用值QoE隨基站個數(shù)的變化曲線。圖8表示MEO衛(wèi)星個數(shù)為3、LEO衛(wèi)星個數(shù)為4、基站個數(shù)為8時3種匹配博弈算法系統(tǒng)總體效用值QoE隨用戶個數(shù)的變化曲線。
圖6 3種算法隨LEO衛(wèi)星個數(shù)變化
圖8 3種算法隨用戶個數(shù)變化
由圖6和圖7可知,隨著LEO衛(wèi)星個數(shù)和基站個數(shù)的增多三者算法的QoE呈正相關(guān),很好地驗證了匹配博弈的有效性;從圖8中可看出隨著用戶數(shù)量的增多三者算法的QoE在逐漸減少,當(dāng)用戶數(shù)目逐漸增多時,每個用戶所獲得的頻譜資源不斷減少。當(dāng)用戶數(shù)增長到一定程度后,由于資源是固定不變的,最終能匹配到的用戶數(shù)有限,因此最終的QoE會逐漸趨于穩(wěn)定。由圖6~圖8可以看出,多層多對多匹配博弈的QoE始終比其余2種高,這也很好地說明了多對多匹配博弈能更好地提高社會效益,使通信系統(tǒng)擁有更高的資源利用率。
針對多用戶場景下的網(wǎng)絡(luò)資源分配問題,不同于傳統(tǒng)波束信道資源分配策略,本文提出一種新的資源分配策略——匹配博弈,在建立MEO衛(wèi)星、LEO衛(wèi)星、基站和用戶四者之間多層多對多匹配博弈模型下,根據(jù)系統(tǒng)目標(biāo)函數(shù)設(shè)計相應(yīng)的匹配博弈算法,從效用函數(shù)的角度對其進(jìn)行求解。通過引入多層多對一匹配和多層一對一匹配算法,從匹配博弈的穩(wěn)定性、有效性和收斂性等性能指標(biāo)入手,與多層多對多匹配博弈進(jìn)行對比,仿真結(jié)果表明多層多對多匹配博弈策略能有效解決資源分配問題,并使衛(wèi)星通信系統(tǒng)擁有更好的社會效益和更高的資源利用率。