潘長(zhǎng)鵬 汲萬(wàn)峰 韓玉龍
(海軍航空大學(xué) 煙臺(tái) 264001)
隨著信息時(shí)代的不斷發(fā)展,人們需求的各種無(wú)線(xiàn)通信業(yè)務(wù)日益增加,支持各種無(wú)線(xiàn)業(yè)務(wù)的通信系統(tǒng)層出不窮、日新月異,無(wú)線(xiàn)頻譜成為越來(lái)越緊缺的資源。雖然已存在的各種通信系統(tǒng)都在使用新技術(shù)提高其自身的頻譜利用率,但有限的頻譜資源也越來(lái)越不能滿(mǎn)足日益增長(zhǎng)的用戶(hù)需求。從時(shí)域和空域的角度觀察發(fā)現(xiàn),靜態(tài)授權(quán)分配的頻段存在許多未被充分利用的“頻譜空洞”,也就是頻譜的利用率非常低,這與頻譜資源日益短缺的問(wèn)題互相矛盾[1]。因此認(rèn)知無(wú)線(xiàn)電技術(shù)(CR)應(yīng)運(yùn)而生。
CR技術(shù)可以實(shí)現(xiàn)認(rèn)知用戶(hù),也即次級(jí)用戶(hù)在空閑頻段上進(jìn)行通信,空閑頻段主要包括非授權(quán)頻段和授權(quán)頻段。在授權(quán)頻段上進(jìn)行通信就要求次級(jí)用戶(hù)要具有認(rèn)知能力,可以對(duì)其周?chē)鸁o(wú)線(xiàn)環(huán)境的歷史和當(dāng)前狀況進(jìn)行檢測(cè)、分析、學(xué)習(xí)、推理和規(guī)劃,以使用授權(quán)用戶(hù)的空閑頻譜信道資源進(jìn)行通信,從而提高頻譜的使用效率例。CR技術(shù)的出現(xiàn),為解決頻譜資源短缺,實(shí)現(xiàn)頻譜動(dòng)態(tài)管理以及提高頻譜利用率開(kāi)創(chuàng)了嶄新的局面。
假定次用戶(hù)有完美的頻譜感知能力,次用戶(hù)采用正交式頻譜接入進(jìn)行通信,次用戶(hù)對(duì)頻譜空洞的使用不會(huì)對(duì)主用戶(hù)造成任何干擾。次用戶(hù)感知到可用頻譜后,要解決的主要問(wèn)題就是各用戶(hù)如何高效地使用空閑頻譜。這時(shí),可用的帶寬也隨之確定,次用戶(hù)可以控制的資源就只有調(diào)制方式和發(fā)射功率。我們將不考慮用戶(hù)所采用的具體信號(hào)調(diào)制方式,理想地認(rèn)為用戶(hù)采用了最適合信道傳輸?shù)哪撤N調(diào)制方式。在這樣的條件下,次用戶(hù)可控制的資源就只有發(fā)射功率了[2]。因此,該信息系統(tǒng)可以看作是功率維約束下的柔性系統(tǒng)構(gòu)建問(wèn)題,也是一個(gè)動(dòng)態(tài)頻譜管理問(wèn)題。該問(wèn)題可以描述為在已經(jīng)準(zhǔn)確感知到可用空閑頻譜后,各次用戶(hù)在頻譜上合理分配功率,以實(shí)現(xiàn)頻譜的高效使用。
假設(shè)有K個(gè)次用戶(hù),感知到N個(gè)空閑頻段可以使用,在頻譜管理算法執(zhí)行過(guò)程中可用空閑頻譜不發(fā)生變化,i表示次用戶(hù),n表示頻段。第i個(gè)次用戶(hù)在第n個(gè)頻段功率分配情況表示,表示用戶(hù)i的最大發(fā)射功率。顯然,用戶(hù)i分配的總功率不能超過(guò)其最大發(fā)射功率,即:
用戶(hù)i的收益不僅與自己功率分配情況有關(guān),還要受到其他用戶(hù)的影響,因此用戶(hù)i的效用(收益)函數(shù)可寫(xiě)為
對(duì)于一個(gè)網(wǎng)絡(luò)而言,衡量其性能的指標(biāo)是各個(gè)用戶(hù)效用的函數(shù),因此該模型可寫(xiě)為如下形式的優(yōu)化問(wèn)題:
用戶(hù)的效用函數(shù)可以根據(jù)實(shí)際應(yīng)用背景的要求而變化,并不唯一。但是對(duì)于一個(gè)通信用戶(hù)而言,他最關(guān)心的其服務(wù)質(zhì)量,而其服務(wù)質(zhì)量的一個(gè)重要的指標(biāo)就是數(shù)據(jù)傳輸速率[3]。用戶(hù)的傳輸速率不僅與自身的功率有關(guān),還與其他用戶(hù)的干擾有關(guān),從信息論角度看,這是個(gè)干擾信道問(wèn)題。眾所周知,干擾信道的容量域目前還不知道,因此不能準(zhǔn)確地寫(xiě)出用戶(hù)速率的表達(dá)式。可做如下合理簡(jiǎn)化:假定用戶(hù)發(fā)射的是復(fù)高斯信號(hào),接收端的噪聲為高斯噪聲,不使用干擾消除技術(shù),接收端僅把干擾作為高斯噪聲處理。這樣,用戶(hù)i的效用函數(shù)可用下式表達(dá):
對(duì)于系統(tǒng)效用函數(shù),有下面四種選擇。
實(shí)際選用哪個(gè)作為系統(tǒng)性能指標(biāo)則根據(jù)需要而定。
在上面建立了頻譜管理的優(yōu)化模型。但是,在上面任意的系統(tǒng)目標(biāo)函數(shù)下,該問(wèn)題幾乎都是個(gè)NP-hard的問(wèn)題,在當(dāng)前理論下多項(xiàng)式時(shí)間內(nèi)找到其最優(yōu)解是不可能的。下面我們采用博弈論方法來(lái)求解此問(wèn)題[4]。
之所以采用博弈論的方法,是出于以下幾方面的原因。第一,動(dòng)態(tài)頻譜管理問(wèn)題是一個(gè)次用戶(hù)之間爭(zhēng)奪頻譜資源的問(wèn)題,一個(gè)次用戶(hù)的行為會(huì)對(duì)其他次用戶(hù)的收益造成影響。而博弈論正是研究沖突的數(shù)學(xué),所以該問(wèn)題與博弈論研究的內(nèi)容性質(zhì)比較吻合,可以放到博弈論的框架下分析。第二,博弈論提供了多種不同的最優(yōu)性準(zhǔn)則,即均衡點(diǎn)。不同的應(yīng)用場(chǎng)景下,可以采用不同的均衡定義或者博弈類(lèi)型對(duì)問(wèn)題進(jìn)行分析,而不是僅限于最優(yōu)化問(wèn)題,博弈所帶來(lái)的這種方便性是優(yōu)化所不具備的。第三,應(yīng)用非合作博弈理論可以有效地尋找解決動(dòng)態(tài)頻譜管理問(wèn)題的非中心式方法,特別是在無(wú)法建立中心控制機(jī)制的時(shí)候,這種非中心式的方法就更加重要。而且從目前來(lái)看,無(wú)線(xiàn)通信越來(lái)越向著分布式的方向發(fā)展,在這個(gè)背景下,探討動(dòng)態(tài)頻譜管理的非中心式方法也有其重大意義[5]。
優(yōu)化問(wèn)題是從系統(tǒng)的角度來(lái)看問(wèn)題,因此目標(biāo)函數(shù)是對(duì)整個(gè)系統(tǒng)總體性能的一個(gè)描述。博弈與優(yōu)化的一個(gè)區(qū)別在于,博弈是從每個(gè)局中人的角度來(lái)看待問(wèn)題。對(duì)于非合作博弈而言,局中人關(guān)心的只是自己的利益,而不關(guān)心對(duì)其他局中人的影響[6]。每個(gè)局中人追求的是自身利益的最大化。因此,對(duì)于動(dòng)態(tài)頻譜管理問(wèn)題,其非合作博弈模型可以用策略式描述如下:
1)局中人:次用戶(hù),i=1,2,…,K
與優(yōu)化模型相比,博弈模型中并沒(méi)有考慮系統(tǒng)的效用函數(shù),這在一定程度上簡(jiǎn)化了計(jì)算復(fù)雜度,同時(shí)也不能保證系統(tǒng)效用函數(shù)有很好的性能。此外,非合作博弈中,用戶(hù)間不協(xié)作,沒(méi)有或者有非常少的信息交流,這就為動(dòng)態(tài)頻譜管理的非中心式實(shí)現(xiàn)提供了可能性[7]。
對(duì)非合作博弈問(wèn)題最重要的是找到其納什均衡點(diǎn),因此均衡點(diǎn)的存在性是個(gè)很重要的問(wèn)題。動(dòng)態(tài)頻譜管理博弈是個(gè)策略空間連續(xù)的博弈問(wèn)題,其效用函數(shù)是連續(xù)的,納什的存在性定理并不能直接適用于該問(wèn)題,但這類(lèi)博弈的混合策略納什均衡點(diǎn)仍然一定存在。而在混合策略均衡點(diǎn),發(fā)送端的功率并不確定,而是以一定的概率采用一定功率發(fā)送,這無(wú)疑會(huì)增加系統(tǒng)的復(fù)雜性,實(shí)現(xiàn)起來(lái)并不簡(jiǎn)單。因此,我們更關(guān)心的是純策略納什均衡點(diǎn)。
定理:令G表示策略式非合作博弈。如果對(duì)任意局中人i,其策略空間Si是個(gè)非空緊凸集,效用函數(shù)ui()
s是s的連續(xù)函數(shù),是si的擬凹函數(shù),則博弈G至少有一個(gè)純策略納什均衡點(diǎn)。
考慮動(dòng)態(tài)頻譜管理博弈,局中人i的策略空間:
該空間是個(gè)緊凸集。局中人i的效用函數(shù):
容易驗(yàn)證效用是s的連續(xù)函數(shù)和si的凹函數(shù),因此也是si的擬凹函數(shù)。所以該博弈問(wèn)題至少存在一個(gè)純策略納什均衡點(diǎn)[8]。
上面已經(jīng)證明了系統(tǒng)博弈均衡點(diǎn)的存在性,現(xiàn)在的問(wèn)題就是如何找到均衡點(diǎn)。一般來(lái)講求解納什均衡是個(gè)復(fù)雜度很高的問(wèn)題,但根據(jù)前面介紹的博弈最優(yōu)響應(yīng)動(dòng)態(tài)可以部分地解決頻譜管理博弈均衡點(diǎn)求解問(wèn)題。該思想最早由Yu Wei等提出并用于處理DSL中的功率控制問(wèn)題,也是目前為止應(yīng)用最廣泛的方法之一[9]。
對(duì)于次用戶(hù)i而言,當(dāng)其他次用戶(hù)的策略固定后,最優(yōu)響應(yīng)就是如下優(yōu)化問(wèn)題的解:
因?yàn)榧俣ㄆ溆啻斡脩?hù)策略不變,所以次用戶(hù)i的效用函數(shù)的分母是個(gè)常數(shù),該優(yōu)化問(wèn)題就是一個(gè)凹問(wèn)題,與信息論中經(jīng)典的并行信道最優(yōu)功率分配問(wèn)題類(lèi)似,采用拉格朗日乘法可以得到解為[10]
有了最優(yōu)響應(yīng)函數(shù),下面的問(wèn)題就是如何讓次用戶(hù)同時(shí)滿(mǎn)足最優(yōu)響應(yīng)條件。該過(guò)程可以采取兩種迭代方案實(shí)現(xiàn),一種是Gauss-Seidel迭代方法,另一種是Jacobi迭代方法[11]。
1)Gauss-Seidel方法:每個(gè)博弈階段,僅有一個(gè)次用戶(hù)依據(jù)最優(yōu)響應(yīng)函數(shù)更新策略,其余次用戶(hù)保持不變[12]:
2)Jacobi方法:每個(gè)博弈階段,所有次用戶(hù)認(rèn)為其他次用戶(hù)的策略不變,同時(shí)按最優(yōu)響應(yīng)函數(shù)更新策略[13]:
根據(jù)這兩種不同的方法,可以得到兩個(gè)求解納什均衡點(diǎn)的迭代算法[14]。
(1)采用Gauss-Seidel迭代方法
對(duì)所有次用戶(hù),初始化功率分配向量 pi=0,初始化迭代次數(shù)t=0。
重復(fù)迭代
(2)采用Jacobi迭代方法
對(duì)所有次用戶(hù),初始化功率分配向量 pi=0,初始化迭代次數(shù)t=0。
重復(fù)迭代
兩種算法可統(tǒng)稱(chēng)為迭代注水算法。兩種算法的區(qū)別主要在于次用戶(hù)更新策略的順序不同,算法1中用戶(hù)i要等前i-1個(gè)用戶(hù)完成更新后才計(jì)算更新自己的最優(yōu)策略,算法2中所有次用戶(hù)都在同一時(shí)刻計(jì)算最優(yōu)策略并更新。因此當(dāng)網(wǎng)絡(luò)中次用戶(hù)數(shù)較多時(shí),算法2的速度要更快,但這種迭代方式也更容易進(jìn)入循環(huán)狀態(tài),從而不能收斂。對(duì)于兩種算法,都要求次用戶(hù)相信,在自己更新功率時(shí),其余次用戶(hù)保持先前策略不變,該要求在實(shí)際中是合理的。如果有多個(gè)均衡點(diǎn),兩種方法收斂到的均衡點(diǎn)不一定相同。初始點(diǎn)不一定要選用零點(diǎn),這里選用零點(diǎn)僅是為了簡(jiǎn)單[15~16]。
本文在基于功率制約的信息系統(tǒng)柔性構(gòu)型方法研究過(guò)程中,給出了求解納什均衡點(diǎn)的迭代注水方法,納什均衡的基礎(chǔ)是完全信息非合作博弈。完全信息,具體到迭代注水算法中就是次用戶(hù)發(fā)送端要可以準(zhǔn)確得到目標(biāo)通信對(duì)間的信道功率增益及各個(gè)信道受到的干擾。然而在實(shí)際信息系統(tǒng)中,完全準(zhǔn)確地估計(jì)信道功率增益是不可能的,估計(jì)值或多或少都會(huì)有誤差存在,此時(shí)完全信息非合作博弈已經(jīng)不再適用描述這種情況。信道估計(jì)值存在誤差,可理解為次用戶(hù)的信息不完全。傳統(tǒng)博弈論中,處理不完全信息的工具是由Hars提出的貝葉斯博弈,該博弈使用概率論的方法建模系統(tǒng)中參數(shù)的不確定性,因此該方法要求有不確定性參數(shù)的概率分布信息,這往往使得處理的問(wèn)題變得非常復(fù)雜,而且概率分布信息能否得到也是個(gè)問(wèn)題。對(duì)此在下一步研究中可以使用穩(wěn)健博弈的方法處理信息不完全性。