(蘭州理工大學(xué)計(jì)算 機(jī)與通信學(xué)院,甘肅 蘭州 730050)
近年來(lái),隨著移動(dòng)無(wú)線通信技術(shù)的快速發(fā)展,用戶對(duì)網(wǎng)絡(luò)的服務(wù)類型和QoS不斷提高。新的無(wú)線通信技術(shù)對(duì)無(wú)線通信帶寬需求也提出了更高的要求[1]。致使通信系統(tǒng)的設(shè)計(jì)者和管理者不斷提高無(wú)線通信的頻譜效率、功率效率和系統(tǒng)容量等。根據(jù)美國(guó)聯(lián)邦通信委員會(huì)(FCC)的調(diào)查結(jié)果顯示[2]:在各個(gè)時(shí)間段和地區(qū),只有15%~85%授權(quán)頻譜被有效利用,3 GHz以下頻段的平均利用率低到僅為5.2%。由此看來(lái),當(dāng)前的固定頻譜分配策略是造成頻譜資源利用率低下和網(wǎng)絡(luò)頻譜資源供不應(yīng)求的主要原因。認(rèn)知無(wú)線網(wǎng)絡(luò)具有感知無(wú)線通信環(huán)境、自適應(yīng)調(diào)整傳輸參數(shù)(功率、載頻和調(diào)制方式)和有效地提高頻譜資源利用率等,都已被學(xué)者提出。
認(rèn)知無(wú)線電網(wǎng)絡(luò)技術(shù)頻譜管理是提高頻譜資源利用率的關(guān)鍵環(huán)節(jié),其常與經(jīng)典的數(shù)學(xué)理論和微觀經(jīng)濟(jì)學(xué)模型相結(jié)合,來(lái)優(yōu)化用戶的頻譜資源分配問(wèn)題[3]。在各種復(fù)雜的數(shù)學(xué)模型中,被提及最多和應(yīng)用最多的就是博弈論模型。在博弈論模型中,參與者為了使自己的收益達(dá)到最大,會(huì)對(duì)自己的策略進(jìn)行選擇和比較?;诖颂匦?,將博弈論與認(rèn)知無(wú)線電網(wǎng)絡(luò)中主用戶、次用戶對(duì)于頻譜的使用很好地結(jié)合,并使得整個(gè)系統(tǒng)具有高度的自組織、自學(xué)習(xí)和自適應(yīng)能力。
博弈論解決動(dòng)態(tài)頻譜分配方法受到了學(xué)者廣泛關(guān)注,文獻(xiàn)[4]提出了一種分布式頻譜共享算法,針對(duì)認(rèn)知用戶的“自私行為”提出了懲罰機(jī)制,并通過(guò)價(jià)格反饋機(jī)制,保證了主用戶和認(rèn)知用戶的最大效用,提高了頻譜資源的利用率。文獻(xiàn)[5]設(shè)計(jì)了一種基于演化博弈的頻譜共享機(jī)制,充分考慮了認(rèn)知無(wú)線電網(wǎng)絡(luò)具有動(dòng)態(tài)、異構(gòu)等特點(diǎn)和無(wú)線信道不可靠、易受環(huán)境影響等因素,確保認(rèn)知用戶之間頻譜共享的公平性。文獻(xiàn)[6]提出了一種基于合作重復(fù)博弈的認(rèn)知無(wú)線電頻譜共享算法,實(shí)現(xiàn)了在兩個(gè)認(rèn)知用戶的環(huán)境下,頻譜共享速率收益的最大化。文獻(xiàn)[7]針對(duì)遠(yuǎn)近效應(yīng)、路徑消耗等問(wèn)題提出了一種新的功率算法,在效用函數(shù)中增加鏈路質(zhì)量和主用戶干擾容下等因素,保證了認(rèn)知用戶在網(wǎng)絡(luò)中的公平性。文獻(xiàn)[8]針對(duì)Underlay接入方式的功率控制進(jìn)行研究,在解決認(rèn)知用戶功率控制問(wèn)題的同時(shí),考慮頻譜分配算法,滿足對(duì)吞吐量和時(shí)延要求不同的各類用戶。文獻(xiàn)[9]在雙人討價(jià)還價(jià)模型基礎(chǔ)上,并提出了在節(jié)點(diǎn)間相互干擾下的多人雙邊模型的頻譜分配模型。文獻(xiàn)[10]提出了一種基于主用戶干擾容限的多人雙邊博弈模型,通過(guò)動(dòng)態(tài)無(wú)限博弈模型,得到子博弈精煉納什均衡。文獻(xiàn)[9]和文獻(xiàn)[10]中貼現(xiàn)因子設(shè)置為相同的定值,當(dāng)通信系統(tǒng)性能變化時(shí),需要重新設(shè)置,不能很好地體現(xiàn)認(rèn)知技術(shù)的自適應(yīng)性。
在上述學(xué)者研究的基礎(chǔ)上,本文提出了一種多人合作重復(fù)博弈模型;將經(jīng)濟(jì)學(xué)中的貼現(xiàn)因子與通信環(huán)境建立聯(lián)系;將各個(gè)認(rèn)知用戶的通信干噪比作為依據(jù)對(duì)用戶進(jìn)行分類和排序,分析并推導(dǎo)認(rèn)知用戶在此策略下的速率總收益,并進(jìn)行實(shí)驗(yàn)驗(yàn)證。
Rubinstein博弈模型是一種聯(lián)盟內(nèi)參與者信息互通的動(dòng)態(tài)博弈。假設(shè)聯(lián)盟中存在兩個(gè)參與者A和B,共同劃分一塊總面積為“1”的土地,A先提出分配方案,即“出價(jià)”;由于聯(lián)盟中信息是互通的,B根據(jù)A的“出價(jià)”選擇接受或者拒絕,如果拒絕,B再提出自己的分配方案,即“還價(jià)”,然后再由A考慮是否接受,以此類推,直到兩個(gè)參與者之間達(dá)成妥協(xié)。
上述博弈過(guò)程中將會(huì)有無(wú)限多個(gè)納什均衡,但只有一個(gè)“子博弈精煉納什均衡”。文獻(xiàn)[11]中提出在無(wú)限期議價(jià)博弈中,先開(kāi)價(jià)者將獲得比后開(kāi)價(jià)者更大的受益(份額),且對(duì)議價(jià)雙方而言,誰(shuí)貼現(xiàn)因子大,耐心程度越大,均衡結(jié)果對(duì)其越有利。所以當(dāng)參與者A先出價(jià)時(shí),A將是最大的受益者。由文獻(xiàn)[9]可知子博弈精煉納什均衡結(jié)果,即A和B最終分得的份額為
(1)
(2)
式中,δ1,δ2分別為參與者A和B的貼現(xiàn)因子。
圖1 輪流出價(jià)的討價(jià)還價(jià)模型
本文考慮在歸一化信道帶寬模型下,N個(gè)認(rèn)知用戶的頻譜分配問(wèn)題。博弈模型中各個(gè)要素如下:
①N個(gè)認(rèn)知用戶為博弈過(guò)程中的參與者即決策主體,用SU1,SU2,…,SUN表示,對(duì)應(yīng)的貼因子為δ1,δ2,…,δN。
在N個(gè)參與者的討價(jià)還價(jià)博弈模型中,N個(gè)參與者按順序向下一個(gè)參與者“開(kāi)價(jià)”,下一個(gè)參與者選擇接受或者拒絕。當(dāng)下一個(gè)參與者選擇接受時(shí),則繼續(xù)按序“開(kāi)價(jià)”;選擇拒絕時(shí),子博弈結(jié)束,進(jìn)入下一個(gè)子博弈過(guò)程。
假設(shè)子博弈由SUi開(kāi)始,向SUi+1提出SUi分得份額xi,SUi+1選擇接受或拒絕。兩種情況下的具體描述為:
① 若SUi+1接受,SUi獲得xi并不參與接下來(lái)所有的子博弈過(guò)程。而SUi+1就剩下的資源,繼續(xù)找SUi+2,SUi+1提出分走xi+1。
② 若在當(dāng)前的子博弈中SUi拒絕,則當(dāng)前的子博弈結(jié)束,進(jìn)入下一個(gè)子博弈過(guò)程。并由SUi+1最先開(kāi)始出價(jià)。
基于上述分析,子博弈過(guò)程可表示為
(3)
其中,xi=x′i,yi為引入中間變量,由式(3)可得
(4)
達(dá)到子博弈精煉納什均衡時(shí),各個(gè)參與者之間策略的關(guān)系為
(5)
得到各個(gè)參與者之間的策略關(guān)系后,認(rèn)知用戶將以此為依據(jù)對(duì)頻譜進(jìn)行分配。
考慮單蜂窩小區(qū)的中心輻射式認(rèn)知無(wú)線電網(wǎng)絡(luò)系統(tǒng),對(duì)認(rèn)知用戶進(jìn)行上行功率控制,在該系統(tǒng)中有M個(gè)主用戶,N個(gè)認(rèn)知用戶和一個(gè)基站,假定一個(gè)用戶只包括一個(gè)收發(fā)設(shè)備,基站負(fù)責(zé)頻譜空穴檢測(cè)和頻譜資源分配。
設(shè)第i個(gè)用戶的擴(kuò)頻帶寬為WHz,傳輸速率為Rib/s,發(fā)射功率為pidBm,認(rèn)知用戶i到基站的鏈路增益為hi,主用戶k到認(rèn)知用戶i的鏈路增益為gk,i,基站處的背景噪聲為σ2。則第i個(gè)認(rèn)知用戶在基站處的信干噪比定義為
(6)
考慮不同的認(rèn)知用戶共享頻譜資源存在不同的QoS需求差異和非負(fù)凸函數(shù)的極值存在問(wèn)題,采用文獻(xiàn)[12]中的效用函數(shù)
(7)
效用函數(shù)由兩部分組成,前一部分是以超過(guò)目標(biāo)信干噪比的差值為變量的冪函數(shù),表征認(rèn)知用戶對(duì)信干噪比的滿意程度;后一部分是價(jià)格函數(shù),為了防止認(rèn)知用戶的“自私行為”;不顧及其他認(rèn)知用戶的收益情況下,一味地增大自己的發(fā)射功率來(lái)提高自己的信干噪比。通過(guò)價(jià)格函數(shù)的建立,強(qiáng)迫認(rèn)知用戶進(jìn)行“合作”。
根據(jù)文獻(xiàn)[13]得到關(guān)于功率控制下最優(yōu)功率的迭代公式
(8)
依據(jù)迭代后的最優(yōu)功率得到各個(gè)認(rèn)知用戶最終的信干噪比,并通過(guò)最終的信干噪比基于映射關(guān)系得到每個(gè)用戶在博弈中的貼現(xiàn)因子。
在傳統(tǒng)的增大認(rèn)知無(wú)線電網(wǎng)絡(luò)用戶速率的方法中,通常是基于對(duì)認(rèn)知用戶在發(fā)射功率和基站干擾不超過(guò)給定閾值的約束條件下,對(duì)于認(rèn)知用戶的功率進(jìn)行控制,進(jìn)而最大化各個(gè)認(rèn)知用戶的信噪比以得到各個(gè)用戶的最大傳輸速率。
由香農(nóng)公式可知,認(rèn)知用戶的最大信息傳輸速率,不僅與用戶的信噪比有關(guān),還與認(rèn)知用戶分配的信道帶寬有關(guān)。本文利用上述思想在傳統(tǒng)的功率控制算法上,加入多人雙邊的博弈模型,來(lái)最大化認(rèn)知無(wú)線網(wǎng)絡(luò)中的總用戶速率收益。
ci=bilog2(1+γi)
(9)
其中,bi為分配給認(rèn)知用戶i的帶寬,由上述的博弈模型得
(10)
貼現(xiàn)因子與鏈路質(zhì)量之間的映射關(guān)系為
δi=αγi
(11)
其中α為認(rèn)知用戶的信干噪比γi與相對(duì)應(yīng)的用戶貼現(xiàn)因子δi之間的調(diào)整因子。
認(rèn)知無(wú)線電網(wǎng)絡(luò)系統(tǒng)的總的信息傳送速率
(12)
(13)
多人雙邊博弈頻譜分配算法具體步驟如表1所示。
表1 多人雙邊博弈頻譜分配算法具體步驟
為了驗(yàn)證上述理論,在Matlab軟件平臺(tái)下進(jìn)行仿真實(shí)驗(yàn)。仿真參數(shù)如下:歸一化信道帶寬為1,每個(gè)認(rèn)知無(wú)線電網(wǎng)絡(luò)中包含6個(gè)次用戶和2個(gè)主用戶,每個(gè)認(rèn)知用戶隨機(jī)分布在[500 m,1500 m]之間,初始功率為1×10-3dBm,收到的帶內(nèi)噪聲為5×10-6dBm;主用戶隨機(jī)分布在[10 m,50 m]之間,初始功率為5×10-6dBm。處理增益為2,擴(kuò)頻帶寬和傳輸速率分別為1×106和1×104,目標(biāo)信干噪比γtar=7 。
在傳統(tǒng)的功率控制算法下,各個(gè)地理位置不同的認(rèn)知用戶發(fā)射功率的變化情況如圖2所示。由圖可知,為了確保主用戶的正常通信,6個(gè)認(rèn)知用戶初始設(shè)置的發(fā)射功率由于效用函數(shù)的建立,經(jīng)過(guò)一次牛頓迭代算法后有一定的降低。各個(gè)認(rèn)知用戶為獲得利益最大化,在主用戶的干擾容限范圍內(nèi),認(rèn)知用戶的發(fā)射功率在第二次迭代式有一定的增大,然后到達(dá)穩(wěn)定狀態(tài)。這樣既能保證主用戶的正常通信,也能使認(rèn)知用戶得到最大的吞吐量。
圖2 功率控制算法下的認(rèn)知用戶的發(fā)射功率
各個(gè)認(rèn)知用戶與其發(fā)射功率相對(duì)應(yīng)的信干噪比的變化情況如圖3所示。由于受到主用戶、認(rèn)知用戶之間和帶內(nèi)噪聲的干擾,不同地理位置的認(rèn)知用戶在第一次迭代時(shí)達(dá)到各自信干噪比的最大值;在第二次迭代時(shí),信干噪比隨著發(fā)射功率的降低而降低;最后隨著發(fā)射功率的回升而有所提高并趨于穩(wěn)定。
圖3 功率控制下的各個(gè)認(rèn)知用戶的信干噪比
基于多人雙邊博弈模型的頻譜共享算法的6個(gè)認(rèn)知用戶的收益情況如圖4所示。在博弈模型下,首先根據(jù)認(rèn)知用戶的信干噪比對(duì)認(rèn)知用戶進(jìn)行排列,確定各個(gè)認(rèn)知用戶的博弈順序。然后,建立信干噪比與貼現(xiàn)因子之間的映射關(guān)系,即信干噪比越大的認(rèn)知用戶鏈路質(zhì)量越好,作為“獎(jiǎng)勵(lì)”,給予其較大的貼現(xiàn)因子值并能獲得更多的收益。
圖4 多人雙邊博弈模型下的認(rèn)知用戶的收益
分析對(duì)比在歸一化的信道帶寬的情況下,基于多人雙邊博弈模型的認(rèn)知無(wú)線電網(wǎng)絡(luò)的總體收益和信道帶寬隨機(jī)分配時(shí)的收益情況如圖5所示。① 實(shí)線:基于多人雙邊博弈模型下,認(rèn)知無(wú)線電網(wǎng)絡(luò)20次總體的傳輸速率??梢钥闯?,在博弈模型下,認(rèn)知無(wú)線電網(wǎng)絡(luò)的傳輸速率一直處于一個(gè)較高且穩(wěn)定的狀態(tài)。② 虛線:當(dāng)信道帶寬隨機(jī)分配時(shí),總的傳輸速率的變化情況。每一個(gè)節(jié)點(diǎn)表示系統(tǒng)總的收益,每一次實(shí)驗(yàn)得到6次系統(tǒng)總的收益結(jié)果,將4次頻譜隨機(jī)分配實(shí)驗(yàn)的結(jié)果與本文的算法進(jìn)行比較。由圖可以明顯觀察到本文算法得到的系統(tǒng)總收益趨于穩(wěn)定且都高于隨機(jī)分配時(shí)系統(tǒng)收益。由此可見(jiàn)本文算法對(duì)于認(rèn)知無(wú)線電網(wǎng)絡(luò)總的傳輸數(shù)率的提升。
圖5 基于博弈模型和隨機(jī)分配時(shí)網(wǎng)絡(luò)收益對(duì)比
為了衡量本文算法對(duì)頻譜分配即時(shí)性好壞的指標(biāo),做了兩種分配方式下時(shí)耗的對(duì)比試驗(yàn),結(jié)果如表2所示。選取了3組博弈模型和隨機(jī)分配兩種算法下,認(rèn)知無(wú)線電網(wǎng)絡(luò)在頻譜分配時(shí)所消耗的時(shí)間。從表2中可以看出相比于隨機(jī)分配,博弈模型下的頻譜分配算法可以節(jié)省一半以上的時(shí)間,對(duì)時(shí)延敏感業(yè)務(wù)是很好的提升,博弈模型下的頻譜分配算法的即時(shí)性更好。
表2 頻譜分配時(shí)間對(duì)比 單位:s
本文針對(duì)傳統(tǒng)的功率控制算法為了降低干擾而影響認(rèn)知用戶的QoS的問(wèn)題,提出了多人雙邊博弈模型下的頻譜分配方法。為了提高方法的自適應(yīng)能力,將信干噪比與貼現(xiàn)因子建立映射關(guān)系并依據(jù)信噪比對(duì)認(rèn)知用戶進(jìn)行排序,得到不同信干噪比下的認(rèn)知用戶的收益情況。通過(guò)本文的博弈算法與信道帶寬隨機(jī)分配下的網(wǎng)絡(luò)總收益進(jìn)行對(duì)比后發(fā)現(xiàn),認(rèn)知無(wú)線電網(wǎng)絡(luò)的整體傳輸速率總收益得到了明顯的提升并對(duì)頻譜分配時(shí)間有很大的改善,在提高用戶吞吐量的同時(shí)也對(duì)系統(tǒng)即時(shí)性進(jìn)行了提升。文中僅將信干噪比的大小作為評(píng)價(jià)信道質(zhì)量好壞的主要標(biāo)準(zhǔn),但實(shí)際的通信環(huán)境十分復(fù)雜,信道也將受到多種因素的干擾。下一步將對(duì)多種因素影響下的通信信道進(jìn)行研究,綜合考慮時(shí)間、空間和各種干擾下的鏈路質(zhì)量,并對(duì)不同的影響因素設(shè)置合理的權(quán)重,使各個(gè)認(rèn)知用戶對(duì)頻譜的劃分更加公平。