高麗,趙海峰,穆曉敏
改進(jìn)的基于合作博弈的資源分配和接入控制策略?
高麗,趙海峰,穆曉敏
(鄭州大學(xué)信息工程學(xué)院,鄭州450001)
為了提高頻譜共享的有效性和公平性,提出了一個基于合作博弈的認(rèn)知網(wǎng)絡(luò)頻譜共享模型和接入控制策略。博弈規(guī)則為在滿足各用戶最小收益的前提下,認(rèn)知用戶進(jìn)行相互合作,并最大化總體收益;接入控制策略以滿足服務(wù)質(zhì)量需求為約束條件,并引入懲罰函數(shù),迫使認(rèn)知用戶按照其實際需求競爭頻譜資源。仿真結(jié)果表明:提出的合作博弈模型和接入策略提高了認(rèn)知用戶的總體收益和公平性,改善了系統(tǒng)中認(rèn)知用戶的滿意度。
認(rèn)知無線電;資源分配;合作博弈;接入控制
動態(tài)頻譜分配技術(shù)[1]是認(rèn)知無線電網(wǎng)絡(luò)中的關(guān)鍵技術(shù)之一,如何把空閑頻譜公平、有效地分配給認(rèn)知用戶是研究的熱點問題。博弈論[2]是認(rèn)知無線電系統(tǒng)中分析和解決認(rèn)知用戶頻譜共享的有效方法,因此,基于博弈論的頻譜共享成為研究的熱點。
近年來,許多文獻(xiàn)討論了認(rèn)知無線電中基于博弈論的動態(tài)頻譜分配方法。根據(jù)系統(tǒng)中認(rèn)知用戶之間是否達(dá)成一致的協(xié)議,可以分為合作博弈和非合作博弈。在合作博弈認(rèn)知網(wǎng)絡(luò)模型中,認(rèn)知用戶考慮自身策略對其他用戶的影響,相互之間達(dá)成一定的協(xié)議,最大化總體效用。文獻(xiàn)[3]提出了在寬帶網(wǎng)絡(luò)中基于合作博弈論框架的帶寬分配和定價方法,把博弈過程類比為一個討價還價的問題,用納什議價解作為博弈的解。在非合作博弈認(rèn)知網(wǎng)絡(luò)模型中,認(rèn)知用戶是自私的、理性的,即只考慮最大化自己的效用。文獻(xiàn)[4-6]均采用非合作博弈模擬資源分配過程,每個認(rèn)知用戶只考慮如何使自己的效益最大化,而沒有考慮自己對其他用戶的影響,用納什均衡點作為博弈過程的解;文獻(xiàn)[4-5]沒有考慮用戶的服務(wù)質(zhì)量需求,文獻(xiàn)[6]考慮了認(rèn)知用戶的服務(wù)質(zhì)量需求,提出了一個改進(jìn)的非合作博弈頻譜共享算法,進(jìn)一步提高了頻譜利用率,但是沒有考慮當(dāng)系統(tǒng)中的頻譜資源不能滿足用戶的最小速率需求及一些用戶為了獲得更多的收益而夸大自己的需求時,如何控制接入系統(tǒng)的認(rèn)知用戶個數(shù)和允許哪些用戶接入的問題。
本文在文獻(xiàn)[6]的基礎(chǔ)上,考慮認(rèn)知用戶自身策略對其他用戶的影響,彼此之間達(dá)成具有約束力的協(xié)議,以最大化總體收益為目標(biāo),提出了基于合作博弈的改進(jìn)的效用函數(shù);此外,當(dāng)系統(tǒng)中的頻譜資源不能滿足用戶最小速率需求時,加入了接入控制機制,提高了系統(tǒng)內(nèi)認(rèn)知用戶的滿意度,考慮到用戶為了獲得更多的頻譜資源可能夸大自己的實際速率需求,本文引入了懲罰函數(shù),根據(jù)懲罰函數(shù)來剔除用戶,在博弈過程中,用戶意識到懲罰函數(shù)的存在后,會按照自己的實際需求去競爭頻譜。
2.1 本文提出的合作頻譜共享模型
提出的合作頻譜共享模型如圖1所示。在認(rèn)知無線電系統(tǒng)中,包含一個主用戶和N個認(rèn)知用戶,主用戶把空閑的頻譜資源交由一個頻譜代理商管理,頻譜代理商是一個非盈利的機制,一方面促進(jìn)交易的進(jìn)行,另一方面控制接入系統(tǒng)中認(rèn)知用戶的個數(shù),保證滿足認(rèn)知用戶的最小速率需求。在圖1所示的頻譜中,灰色部分表示主用戶使用的頻譜,黑色部分表示不同用戶之間的保護(hù)帶寬,白色部分表示認(rèn)知用戶共享的頻譜。
頻譜代理商和認(rèn)知用戶之間的信息交換情況如圖2所示。首先,頻譜代理商宣布單位帶寬的定價函數(shù)c,認(rèn)知用戶按照一定的博弈規(guī)則,向頻譜代理商提交博弈策略(即請求的頻譜寬度)集合B(B={b1,b2,…,bN})和最小速率需求Q(Q={Q1,Q2,…,QN})。為了迫使認(rèn)知用戶如實地告之其最小速率需求,頻譜代理商計算每個認(rèn)知用戶的懲罰函數(shù)值θ,并給出接入矩陣A(A={a1,a2,…,aN}),ai=1(i=1,2,…,N)表示準(zhǔn)許接入,ai=0表示不允許接入。
單位帶寬的定價函數(shù)[4]為
懲罰函數(shù)θ定義為
式中,πi表示認(rèn)知用戶i的收益;Bopt表示認(rèn)知用戶j不存在時,N-1個用戶的帶寬分配集合,所以第一項表示認(rèn)知用戶j不存在時N-1個用戶的總收益;B*表示N個用戶的帶寬分配集合,第二項表示認(rèn)知用戶j存在時,其余N-1個用戶的總收益。由懲罰函數(shù)的定義可知,用戶j的懲罰函數(shù)表示由于用戶j的存在而給其他用戶帶來的總收益的減少量。
定義第i個認(rèn)知用戶的收益函數(shù)[6]πi(B):
式中,Qi是滿足服務(wù)質(zhì)量要求所需要的最小傳輸速率,bi為向主用戶請求的頻譜寬度,ri是單位傳輸速率獲得的收益;式(4)中SNRi是信噪比,式(5)中是第i個用戶的目標(biāo)誤碼率。
2.2 改進(jìn)的效用函數(shù)
在合作博弈模型中,認(rèn)知用戶考慮自身策略對其他用戶收益的影響,達(dá)成一定的合作協(xié)議,即在滿足各用戶最小收益的前提下進(jìn)行相互合作,以最大化總體收益為目標(biāo)。基于此認(rèn)知用戶之間的合作博弈問題可以描述為
若分配給認(rèn)知用戶的頻譜資源不能滿足其服務(wù)質(zhì)量需求,則是對系統(tǒng)中頻譜資源的浪費,因此,在頻譜分配過程中應(yīng)考慮控制接入系統(tǒng)中的認(rèn)知用戶的個數(shù)。本文提議的接入策略是以滿足服務(wù)質(zhì)量需求為約束條件,為了迫使認(rèn)知用戶按照其實際需求競爭頻譜,文中引入了懲罰函數(shù)的概念,根據(jù)懲罰函數(shù)來選擇剔除哪些用戶。
定義頻譜滿意度函數(shù)[6]
其中,Si<1表示分配的帶寬不能滿足最小速率需求,Si≥1表示滿足了用戶最小速率需求。
頻譜分配算法步驟如下:
(1)初始化每一個認(rèn)知用戶的博弈策略b0={b1,b2,…bN}和接入矩陣A=ones(1,N);
(3)判斷是否存在Si<1,?i,若存在,轉(zhuǎn)步驟4;若不存在,結(jié)束;
(4)按照公式(2)計算每一個用戶的懲罰函數(shù)值,對θ進(jìn)行從高到低的排序,剔除θ值最大的用戶,并置相應(yīng)的ai=0,更新接入矩陣A,再轉(zhuǎn)步驟2重新分配頻譜。
為了驗證本文提出的效用函數(shù)和接入策略的有效性,基于Matlab平臺進(jìn)行仿真分析,設(shè)定主用戶擁有20 MHz的空閑帶寬,所有認(rèn)知用戶在任何傳輸模式下的目標(biāo)BER為BERtari=10-4,每單位傳輸速率的收益為ri=10。
4.1 合作博弈的性能分析
對文中的合作博弈和文獻(xiàn)[6]中的非合作博弈情況進(jìn)行仿真分析。為了簡化分析,仿真過程中假設(shè)認(rèn)知無線電系統(tǒng)中存在一個主用戶和兩個認(rèn)知用戶,認(rèn)知用戶的信噪比分別為12 dB、11 dB,分配頻譜的初始值b1=b2=3 MHz,πmini=3,?i,認(rèn)知用戶2的最小速率需求固定為4,仿真結(jié)果如圖3所示。
由圖3可以看出,隨著認(rèn)知用戶1的最小速率需求的增加,認(rèn)知用戶1和2的總收益在增大,合作博弈的總收益大于非合作博弈的總收益。這是因為在非合作博弈過程中,認(rèn)知用戶只最大化自己的收益,而沒考慮自己的競爭策略給其它用戶收益帶來的影響;認(rèn)知用戶進(jìn)行合作博弈時,在滿足其最小速率需求后,以最大化總體收益為目標(biāo)。
為了比較兩種方法的公平性,文中選用文獻(xiàn)[10]中的公平指數(shù)來進(jìn)行評價,考慮N個認(rèn)知用戶,每一個認(rèn)知用戶獲得的收益為πi,本文公平指數(shù)的定義為
式中,β越接近于1,說明公平性較高;反之,則說明公平性較差。
圖4顯示了隨著認(rèn)知用戶1的最小速率需求的增加,兩種方法的公平指數(shù)變化情況,可以看出合作博弈的公平性高于非合作博弈。
4.2 懲罰函數(shù)的性能
為了評估懲罰函數(shù)的性能,比較兩種情形下各認(rèn)知用戶的θ值:一是所有認(rèn)知用戶都按照其實際最小速率需求競爭頻譜資源;二是有一個認(rèn)知用戶夸大其速率需求,其他用戶仍按照實際需求競爭頻譜資源。仿真過程中設(shè)定有5個認(rèn)知用戶,在第一種情況下,所有用戶的最小速率需求設(shè)為4,即Q1= Q2=…=Q5=4;在第二種情況下,認(rèn)知用戶1夸大其最小速率需求Q1=6,其他認(rèn)知用戶最小速率需求仍為4。
由表1可知,當(dāng)認(rèn)知用戶1夸大其需求后,其得到的帶寬資源有所增加,但同時其懲罰函數(shù)值θ也增大了,且成為5個用戶中最大的,根據(jù)本文中的頻譜分配算法可知,如果系統(tǒng)中存在Si<1,?i,用戶1將被首先剔除。
4.3 加入接入控制機制后系統(tǒng)性能分析
仿真過程中,設(shè)定系統(tǒng)中存在一個主用戶和8個認(rèn)知用戶,認(rèn)知用戶的信噪比在[10,14]上服從均勻分布,最小速率需求服從[Qi,Qi+4]的均勻分布,Qi是隨機變量。由圖5可以看出,系統(tǒng)中無接入控制機制時[6],認(rèn)知用戶的平均滿意度小于1;加入接入控制機制后,認(rèn)知用戶的平均滿意度大于1。
圖6表示隨著認(rèn)知用戶最小速率需求的增大,系統(tǒng)中允許接入的用戶個數(shù)在減小。因此可以根據(jù)認(rèn)知用戶的需求,確定系統(tǒng)中允許接入的最大的認(rèn)知用戶個數(shù),滿足系統(tǒng)內(nèi)認(rèn)知用戶的服務(wù)質(zhì)量需求,提高系統(tǒng)中認(rèn)知用戶的滿意度。
本文針對在認(rèn)知無線網(wǎng)絡(luò)中,認(rèn)知用戶為了獲得更多的收益,在競爭頻譜資源時可能存在欺騙行為,夸大自己的實際資源需求,建立了基于合作博弈的認(rèn)知網(wǎng)絡(luò)頻譜共享模型和接入控制機制,從而提高了頻譜分配的有效性和公平性。仿真結(jié)果顯示,相對于非合作博弈,改進(jìn)的效用函數(shù)提高了認(rèn)知用戶的總體收益,且公平性較高;接入控制機制改善了系統(tǒng)中用戶的滿意度,有效地阻止了用戶的欺騙行為,適用于實際的無線認(rèn)知網(wǎng)絡(luò)。另外,本文模型中只考慮了一個主用戶和多個認(rèn)知用戶的情形,當(dāng)擴展到多個主用戶和多個認(rèn)知用戶時,有關(guān)主用戶之間的頻譜定價博弈、主用戶和認(rèn)知用戶之間的頻譜交易規(guī)則的設(shè)定等問題,有待進(jìn)一步研究。
[1]Akyildiz I F,Lee W Y,Vuran M C,et al.Next generation/dynamic spectrum access/cognitive radio wireless networks:A survey[J].Computer Networks(Elsevier),2006,50(13):2127-2159.
[2]Fudenberg D,Tirole J.Game Theory[M].Cambridge,MA:MIT Press,1991.
[3]Yaiche H,Mazumdar R R,Rosenberg C.A Game Theoretic Framework for Bandwidth Allocation and Pricing in Broadband Networks[J].IEEE/ACM Transactions on Networking,2000,8(5):667-678.
[4]Niyato D,Hossain E.Competitive Spectrum Sharing in Cognitive Radio Networks:A Dynamic Game Approach[J].IEEE Transactions on Wireless Communications,2008,7(7):2651-2660.
[5]Lin P,Jia J,Zhang Q,et al.Dynamic Spectrum Sharing With Multiple Primary and Secondary Users[J].IEEE Transactions on Vehicular Technology,2011,60(4):1756-1765.
[6]Li Y B,Wang L,Li Y.An improved game-theoretic spectrum sharing algorithm in cognitive radio networks[C]//Proceedings of IEEE International Conference on Computer Research and Development.Shanghai,China:IEEE,2011:499-503.
[7]Han Z,Ji Z,Liu K J R.Fair multiuser channel allocation for OFDMA networks using Nash bargaining solutions and coalitions[J].IEEE Transactions on Communications,2005,53(8):1366-1376.
[8]Zhang Z Y,Shi J,Chen H H,et al.A Cooperation Strategy Based on Nash Bargaining Solution in Cooperative Relay Networks[J].IEEE Transactions on Vehicular Technology,2008,57(4):2570-2577.
[9]Boyd S,Vandenberghe L.Convex Optimization[M].Cambridge,UK:Cambridge University Press,2004.
[10]Jain R,Chiu D M,Hawe W.A Quantitative Measure of Fairness and Discrimination for Resource Allocation in Shared Computer System[R].[S.l.]:DEC Research Report,1984.
GAO Li was born in Nanyang,Henan Province,in 1985.She received the B.S.degree from Tianjin Polytechnic University in 2010.She is now a graduate student.Her research concerns resource allocation based on game theory in cognitive radio networks.
Email:dz061gaoli@sina.com
趙海峰(1984—),男,河南扶溝人,2006年于鄭州大學(xué)獲工學(xué)學(xué)士學(xué)位,現(xiàn)為博士研究生,主要研究方向為認(rèn)知無線電協(xié)作感知;
ZHAO Hai-feng was born in Fugou,Henan Province,in 1984.He received the B.S.degree from Zhengzhou University in 2006.He is currently working toward the Ph.D.degree.His research concerns spectrum sensing in cognitive radio networks.
Email:zhf198769@163.com
穆曉敏(1955—),女,河南鄭州人,教授、博士生導(dǎo)師,主要研究方向為通信信號處理、圖像信號處理、數(shù)字水印技術(shù)、認(rèn)知無線電技術(shù)等。
MU Xiao-min was born in Zhengzhou,Henan Province,in 1955.She is now a professor and also the Ph.D.supervisor.Her research interests include communication signal processing,image signal processing,digital watermarking technology,cognitive radio,etc.
Email:iexmmu@zzu.edu.cn
Improved Resource Allocation Based on Cooperative Game and Access Control Policy
GAO Li,ZHAO Hai-feng,MU Xiao-min
(Information Engineering School,Zhengzhou University,Zhengzhou 450001,China)
In order to improve the efficiency and fairness of spectrum sharing,a spectrum sharing model based on cooperative game and an access control policy are proposed.Cognitive users cooperate with each other to maximize overall benefits on the premise of meeting users′minimum income.The access control policy takes the satisfaction of service quality requirements as the constraint condition.A penalty function is introduced to force the secondary users to compete spectrum according to their actual requirements.The simulation results show that the cooperative game model and the access policy proposed in this paper enhance the overall benefits and fairness of cognitive users and improve the cognitive users′satisfaction in the system.
cognitive radio;resource allocation;game theory;access control
The National Natural Science Foundation of China(No.60702020)
TN92;TN915
A
10.3969/j.issn.1001-893x.2012.07.028
高麗(1985—),女,河南南陽人,2010年于天津工業(yè)大學(xué)獲工學(xué)學(xué)士學(xué)位,現(xiàn)為碩士研究生,主要研究方向為認(rèn)知無線電中基于博弈論的資源分配;
1001-893X(2012)07-1183-05
2011-12-02;
2012-02-22
國家自然科學(xué)基金資助項目(60702020)