于永生 李翠然 謝健驪
(蘭州交通大學(xué)電子與信息工程學(xué)院 甘肅 蘭州 730070)
無線電頻譜是一種稀缺資源,在移動(dòng)通信中發(fā)揮著不可替代的重要作用。近年來,隨著移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的快速發(fā)展,各類新業(yè)務(wù)和應(yīng)用場(chǎng)景不斷涌現(xiàn),催生了大量高速率、低延遲的傳輸需求,導(dǎo)致無線數(shù)據(jù)流量激增,頻譜短缺加劇[1-2]。為了應(yīng)對(duì)不斷增長(zhǎng)的流量負(fù)載,探索額外的可用頻譜正變得越來越迫切。目前各國(guó)的頻譜管理普遍采用靜態(tài)分配策略,即頻譜被劃分成不同的授權(quán)頻段,并固定分配給特定的用戶獨(dú)占使用,盡管這樣避免了用戶間的相互干擾,但同時(shí)也造成了頻譜資源的嚴(yán)重浪費(fèi)[3]?;谡J(rèn)知無線電的頻譜共享能極大提高頻譜使用的靈活性,進(jìn)而促進(jìn)頻譜資源的高效利用,因此被認(rèn)為是解決頻譜短缺問題的有效方案[4]。在認(rèn)知無線電頻譜共享中,次用戶(認(rèn)知用戶)可以租借使用主用戶(頻段授權(quán)用戶)暫時(shí)空閑的頻譜資源,并向主用戶支付一定的費(fèi)用。這種市場(chǎng)驅(qū)動(dòng)的頻譜共享模式被稱為頻譜交易,因其在分配效率、公平性和經(jīng)濟(jì)激勵(lì)等方面的優(yōu)勢(shì),已成為無線通信領(lǐng)域中的研究熱點(diǎn)之一[5-13]。
Li等[6]提出了一種基于霍特林模型的頻譜定價(jià)迭代算法,將頻譜的質(zhì)量差異和次用戶的隨機(jī)偏好作為必要因素納入考慮,以提高頻譜交易中次用戶的效用。Khairullah等[7]提出了一種基于雙重拍賣的頻譜共享框架,其中信號(hào)與干擾加噪聲比(SINR)不僅是信道的質(zhì)量指標(biāo),同時(shí)也被作為次用戶對(duì)頻譜偏好的度量。據(jù)此設(shè)計(jì)的“贏家決定”和定價(jià)機(jī)制實(shí)現(xiàn)了頻譜與次用戶的雙向匹配。Khaledi等[8]提出了一種整合多臂賭博機(jī)模型的頻譜拍賣機(jī)制,并制定了指數(shù)型的頻譜分配策略,允許次用戶根據(jù)信道質(zhì)量變化動(dòng)態(tài)調(diào)整頻譜估值,目標(biāo)是最大化預(yù)期的社會(huì)福利折扣。Niyato等[9]利用寡頭壟斷市場(chǎng)和Bertrand博弈模型提出了一種基于納什均衡的頻譜定價(jià)算法,并分析了信道質(zhì)量、頻譜替代性等系統(tǒng)參數(shù)對(duì)均衡價(jià)格的影響,算法旨在最大化主用戶在服務(wù)質(zhì)量(QoS)約束下的利潤(rùn)。
次用戶在頻譜交易中作為買方,通常可以從多個(gè)主用戶處購買頻譜。頻譜的垂直差異(即信道質(zhì)量差異)對(duì)頻譜交易的影響已在現(xiàn)有文獻(xiàn)中得到充分考慮。本文考慮另外兩個(gè)被忽略的重要影響因素:① 不同的主用戶擁有各自不同的授權(quán)頻段,這些頻譜因頻率的高低不同而具有水平差異,具體表現(xiàn)為不同的電磁波傳播特性、抗干擾能力、覆蓋能力和信息承載能力等,次用戶傾向于選擇更加適宜承載其業(yè)務(wù)的頻譜,即次用戶在頻譜選擇上具有頻段偏好;② 有的主用戶售讓頻譜時(shí)隙后,為了最大化自身收益,可能會(huì)出現(xiàn)提前收回頻譜的不誠信行為(包含但不限于:訪問頻譜并形成干擾、將頻譜同時(shí)租售給其他的次服務(wù)等)。針對(duì)這兩個(gè)因素,本文設(shè)計(jì)了認(rèn)可度機(jī)制,并將其引入到基于Bertrand博弈的頻譜共享模型當(dāng)中,進(jìn)一步提出了基于認(rèn)可度的主服務(wù)博弈頻譜共享算法(靜態(tài)/動(dòng)態(tài))和與之對(duì)應(yīng)的頻譜租賃框架,旨在促進(jìn)達(dá)成更加合理、有效的頻譜共享。
將主用戶與次用戶間的頻譜共享問題擴(kuò)展為主服務(wù)與次服務(wù)間的頻譜共享問題。如圖1所示為一個(gè)認(rèn)知頻譜共享場(chǎng)景。N個(gè)主服務(wù)工作在各自不同的授權(quán)頻段上,均愿意租讓部分頻譜給次服務(wù)使用,以獲取額外收入。各個(gè)主服務(wù)都是理性而自私的,彼此間通過競(jìng)爭(zhēng)方式向次服務(wù)租讓頻譜,目標(biāo)是通過頻譜共享來最大化各自的利潤(rùn)。單個(gè)主服務(wù)中包含多個(gè)主用戶,這些主用戶均連接于一個(gè)主服務(wù)控制器(Primary Service Controller,PSC)。與之類似,次服務(wù)中的所有次用戶連接于一個(gè)次服務(wù)控制器(Secondary Service Controller,SSC)。主/次服務(wù)的頻譜可以在多個(gè)主/次用戶之間共享,其中基站或接入點(diǎn)控制認(rèn)知無線電網(wǎng)絡(luò)中頻譜機(jī)會(huì)的分配,從而充當(dāng)服務(wù)控制器。
圖1 頻譜共享場(chǎng)景
次服務(wù)同時(shí)從N個(gè)主服務(wù)處租借頻譜,若主服務(wù)i對(duì)單位帶寬頻譜的定價(jià)為pi,則次服務(wù)對(duì)其產(chǎn)生帶寬為bi的頻譜需求。次服務(wù)獲得的頻譜由SSC按照一定的規(guī)則和復(fù)用方式(FDM/TDM/CDM)向所有次用戶分配,次用戶利用自適應(yīng)調(diào)制在所分配的頻譜上進(jìn)行傳輸。次用戶獲得的頻譜既可以用于次用戶與SSC之間的通信,也可以用于次用戶的自組織網(wǎng)絡(luò)(Ad Hoc網(wǎng)絡(luò))內(nèi)的通信。由于主服務(wù)之間進(jìn)行價(jià)格競(jìng)爭(zhēng),彼此的策略選擇(頻譜定價(jià))相互影響、相互制約,單個(gè)主服務(wù)的最優(yōu)化可能會(huì)與其他主服務(wù)的最優(yōu)化產(chǎn)生沖突,因而需要引入博弈論來進(jìn)行分析。
頻譜共享的博弈模型可以表示為:
G={N,{Si}i∈N,{Ui}i∈N}
(1)
在本文中,各個(gè)主服務(wù)根據(jù)觀察到的信息進(jìn)行策略調(diào)整,直至任何一個(gè)主服務(wù)都無法通過單獨(dú)改變策略而增加自身利潤(rùn)時(shí),博弈達(dá)到納什均衡。此時(shí)所有主服務(wù)策略的組合(即頻譜價(jià)格組合)和次服務(wù)相應(yīng)的頻譜需求量即為最終的頻譜共享方案。
次服務(wù)的效用函數(shù)被用來量化次服務(wù)對(duì)不同主服務(wù)的頻譜需求。次服務(wù)獲得頻譜后,利用自適應(yīng)調(diào)制,可以基于信道質(zhì)量動(dòng)態(tài)調(diào)整傳輸速率,傳統(tǒng)的次服務(wù)效用函數(shù)定義如下[9]:
(2)
(3)
式中:γi表示次服務(wù)使用主服務(wù)i的頻譜進(jìn)行傳輸時(shí)接收器的信噪比;K是由誤碼率門限值決定的常數(shù):
(4)
式中:BERtar表示次服務(wù)傳輸?shù)哪繕?biāo)誤碼率。
引入認(rèn)可度參數(shù)及其影響因子,定義次服務(wù)的效用函數(shù)如下:
(5)
式中:θ={θ1,θ2,…,θN}表示認(rèn)可度的集合,元素θi∈[0,1]是次服務(wù)對(duì)主服務(wù)i的認(rèn)可度,θi越大表示認(rèn)可度越高,特別的,當(dāng)θi=1時(shí),表示次服務(wù)對(duì)主服務(wù)i完全認(rèn)可,而當(dāng)θi=0時(shí),則表示完全不認(rèn)可;u∈[0,+∞)是認(rèn)可度參數(shù)的影響因子,用來表示認(rèn)可度參數(shù)對(duì)博弈的影響程度,當(dāng)u越大,表示認(rèn)可度參數(shù)對(duì)博弈的影響程度越重,特別的,當(dāng)u=0時(shí),認(rèn)可度參數(shù)不對(duì)博弈產(chǎn)生影響,效用函數(shù)退化為傳統(tǒng)的效用函數(shù)。
為了獲得主服務(wù)的利潤(rùn)函數(shù),需要考慮主服務(wù)在頻譜共享中的收入和成本。主服務(wù)的收入包括從主用戶收取的固定費(fèi)用和從次服務(wù)收取的頻譜租賃費(fèi)用。成本來自將部分頻譜租讓所引起的性能退化,即主用戶的QoS降級(jí),并且主服務(wù)租讓出的頻譜越多,自身剩余的可用頻譜就越少,主用戶所遭受的QoS降級(jí)也越嚴(yán)重。定義利潤(rùn)為收入減去成本,則主服務(wù)i的利潤(rùn)函數(shù)可表示如下[9]:
(6)
靜態(tài)博弈的納什均衡可以利用最優(yōu)反應(yīng)函數(shù)求得,主服務(wù)i的最優(yōu)反應(yīng)函數(shù)定義如下:
(7)
次服務(wù)根據(jù)效用最大化原則確定對(duì)各個(gè)主服務(wù)的頻譜需求,由式(5)得:
(8)
令?U(b,θ)/?bi=0對(duì)?i成立,解得次服務(wù)的需求函數(shù)如下:
Di(p)=Di(p-i∪{pi})=D1(p-i)-D2pi
(9)
式中:
將需求函數(shù)代入主服務(wù)的利潤(rùn)函數(shù)得:
Pi(p)=pi(D1(p-i)-D2pi)+c1Mi-
(10)
對(duì)pi求偏導(dǎo),得到主服務(wù)的邊際利潤(rùn)如下:
D1(p-i)-2D2pi
(11)
令?Pi(p)/?pi=0對(duì)?i成立得:
(12)
式中:i=1,2,…,N。
在完全信息條件下,式(12)中的所有參數(shù)可用,通過求解該方程組,即可獲得博弈的納什均衡p*。
為了使提出的算法有意義,必須確保其存在納什均衡。本節(jié)利用超模博弈條件,通過數(shù)學(xué)推導(dǎo)對(duì)納什均衡的存在性進(jìn)行證明。
首先給出兩個(gè)相關(guān)定理:
定理2[15]若策略型博弈G={N,{Si}i∈N,{Ui}i∈N}為一個(gè)超模博弈,則純策略的納什均衡存在,且對(duì)于策略空間上給定的序結(jié)構(gòu),最大最小的純策略納什均衡存在。
然后根據(jù)定理進(jìn)行證明,過程如下:
繼續(xù)對(duì)式(11)pj求偏導(dǎo)得:
(13)
又:
(14)
代入式(13)有:
(15)
可見博弈符合超模條件,因此納什均衡存在。
構(gòu)建的頻譜租賃框架如圖2所示。算法完整運(yùn)行一次,稱為一個(gè)算法周期,算法周期運(yùn)行一次結(jié)束到達(dá)穩(wěn)定狀態(tài)(納什均衡)形成一個(gè)頻譜租賃的租期,租期結(jié)束再運(yùn)行下一個(gè)算法周期,形成新的租期。每個(gè)算法周期分三個(gè)階段完成:階段1為認(rèn)可度更新環(huán)節(jié);階段2為主服務(wù)博弈環(huán)節(jié);階段3為納什均衡價(jià)格確定環(huán)節(jié)。在階段1中,次服務(wù)根據(jù)收集到的信息(主服務(wù)的頻段信息、誠信相關(guān)歷史信息)更新對(duì)各個(gè)主服務(wù)的認(rèn)可度,得到認(rèn)可度集合,通過該階段,次服務(wù)給出買家意愿。在階段2中,主服務(wù)之間進(jìn)行價(jià)格博弈(靜態(tài)/動(dòng)態(tài)博弈),通過該階段,主服務(wù)間進(jìn)行競(jìng)爭(zhēng)。在階段3中,根據(jù)博弈結(jié)果得到各個(gè)主服務(wù)的納什均衡價(jià)格,并將該價(jià)格向次服務(wù)反饋,通過該階段,形成頻譜租賃的租約,并進(jìn)入相應(yīng)的租期。
圖2 頻譜租賃框架
(16)
任意的主服務(wù)可以在某個(gè)租期結(jié)束后(下一個(gè)算法周期開始前)自由選擇加入或退出頻譜交易。在每個(gè)算法周期的階段1,確定參加頻譜交易的主服務(wù)后,次服務(wù)收集它們的信息,并更新對(duì)它們的認(rèn)可度,更新過程如圖3所示。
圖3 認(rèn)可度更新機(jī)制
以上提出的頻譜租賃框架和認(rèn)可度更新機(jī)制同時(shí)適用于靜態(tài)博弈和動(dòng)態(tài)博弈兩種情形。
在靜態(tài)博弈情形下,各個(gè)主服務(wù)的策略和利潤(rùn)在彼此間是共同知識(shí),該條件使得各個(gè)主服務(wù)可以直接做出最佳的策略選擇,同時(shí)博弈的納什均衡可以立即達(dá)成。然而在實(shí)際的認(rèn)知無線電環(huán)境中,由于隱私和非合作等原因,各個(gè)主服務(wù)之間未必能觀察到彼此的策略和利潤(rùn)。由于不具備完全信息,主服務(wù)在有限理性條件下無法立即做出最佳的策略選擇,而只能根據(jù)次服務(wù)的頻譜需求信息動(dòng)態(tài)地調(diào)整自己的頻譜定價(jià),以逐步收斂到最佳策略(即納什均衡價(jià)格)。
(17)
(18)
即:
(19)
穩(wěn)定性對(duì)于動(dòng)態(tài)博弈至關(guān)重要,本文通過考慮式(17)中自映射函數(shù)的雅克比矩陣的特征值來分析動(dòng)態(tài)博弈的局部穩(wěn)態(tài)。
由式(17)得:
(20)
(21)
將式(20)、式(21)代入雅克比矩陣,得:
(22)
納什均衡點(diǎn)作為不動(dòng)點(diǎn)之一,當(dāng)且僅當(dāng)雅克比矩陣的全部特征值都位于復(fù)平面的單位圓內(nèi)(即|λi|<1)時(shí),該不動(dòng)點(diǎn)穩(wěn)定。令矩陣J的所有特征值的模小于1,通過解不等式組,即可得到動(dòng)態(tài)博弈的穩(wěn)定區(qū)域。
在不同的認(rèn)可度和信道質(zhì)量條件下,兩個(gè)主服務(wù)的最優(yōu)反應(yīng)函數(shù)如圖4所示。納什均衡位于最優(yōu)反應(yīng)函數(shù)的交點(diǎn),從圖中可以看出,信道質(zhì)量和認(rèn)可度均會(huì)對(duì)其位置造成影響:若信道質(zhì)量變好,則主服務(wù)會(huì)提高頻譜價(jià)格;若次服務(wù)對(duì)某個(gè)主服務(wù)的認(rèn)可度下降,則該主服務(wù)會(huì)降低頻譜價(jià)格,而另外的主服務(wù)會(huì)提高頻譜價(jià)格。實(shí)際上,次服務(wù)在更好的信道質(zhì)量下能獲得更高的傳輸速率,因此頻譜需求增加,此時(shí)主服務(wù)將通過提高頻譜價(jià)格來謀求更大利潤(rùn);當(dāng)某個(gè)主服務(wù)的認(rèn)可度下降時(shí),即代表次服務(wù)從其購買頻譜的意愿減弱,此時(shí)該主服務(wù)將通過采取降價(jià)措施來彌補(bǔ)因競(jìng)爭(zhēng)力下降所造成的損失,而另外的主服務(wù)將通過借機(jī)漲價(jià)謀求更大利潤(rùn)。特別指出,當(dāng)次服務(wù)對(duì)兩個(gè)主服務(wù)均為完全認(rèn)可(即θ1=θ2=1)時(shí),效用函數(shù)退化到原始狀態(tài),由于信道質(zhì)量相同(γ1=γ2),兩個(gè)主服務(wù)為對(duì)稱關(guān)系,因此它們的納什均衡價(jià)格相等。
圖4 最優(yōu)反應(yīng)函數(shù)和納什均衡點(diǎn)
圖5(a)反映了單個(gè)主服務(wù)的認(rèn)可度連續(xù)變化對(duì)納什均衡價(jià)格的影響。設(shè)置主服務(wù)2的認(rèn)可度固定為1不變,主服務(wù)1的認(rèn)可度從0變化到1,從圖中可以看出,隨著主服務(wù)1的認(rèn)可度提高,其納什均衡價(jià)格也提高,與此同時(shí),主服務(wù)2的納什均衡價(jià)格降低,當(dāng)主服務(wù)1的認(rèn)可度增大到1時(shí),兩個(gè)主服務(wù)的納什均衡價(jià)格相等。當(dāng)u=0時(shí),兩個(gè)主服務(wù)的納什均衡價(jià)格相等且保持不變,即此時(shí)認(rèn)可度參數(shù)對(duì)博弈不產(chǎn)生影響。從斜率可以看出,u的值越大,博弈對(duì)認(rèn)可度的變化越敏感,即認(rèn)可度參數(shù)對(duì)博弈結(jié)果的影響越明顯。與圖5(a)類似,圖5(b)和(c)分別反映了次服務(wù)的納什均衡頻譜帶寬和主服務(wù)的納什均衡利潤(rùn)受影響的情況。從圖5總體來看,認(rèn)可度的提高能使相應(yīng)主服務(wù)以更高價(jià)格租出更大頻譜帶寬并獲得更多利潤(rùn),與此同時(shí),認(rèn)可度的降低將是一種有效的懲罰手段。
(a)
(b)
(c)圖5 認(rèn)可度對(duì)納什均衡的影響
圖6為兩個(gè)主服務(wù)的納什均衡利潤(rùn)曲面(u=0.8,γ1=γ2=20 dB)。兩個(gè)曲面是對(duì)稱關(guān)系,交線在底面的投影表示θ1=θ2的直線,也即(0,0)到(1,1)的連線,連線左側(cè)為θ1<θ2的區(qū)域,右側(cè)為θ1>θ2的區(qū)域。從圖中可以看出,在θ1<θ2的區(qū)域,主服務(wù)2的利潤(rùn)更高,而在θ1>θ2的區(qū)域反之。此外,θ2=1的平面與兩個(gè)利潤(rùn)曲面的交線即為圖5(c)中u=0.8的兩條納什均衡利潤(rùn)曲線,兩個(gè)結(jié)果是一致的。從實(shí)際來看,在同等信道質(zhì)量條件下,認(rèn)可度高的主服務(wù)總是可以獲得更多的利潤(rùn),體現(xiàn)了算法的公平性。
圖6 納什均衡利潤(rùn)曲面
假設(shè)在第j-1個(gè)算法周期,次服務(wù)對(duì)兩個(gè)主服務(wù)均為完全認(rèn)可(θ1=θ2=1),主服務(wù)2在第j個(gè)租期中出現(xiàn)提前收回頻譜的不誠信行為,導(dǎo)致次服務(wù)利益受損,次服務(wù)在第j+1個(gè)算法周期通過降低信任度對(duì)其進(jìn)行懲罰(θ1=1,θ2=0.8),在此后的租期中,主服務(wù)2又連續(xù)出現(xiàn)不誠信行為,次服務(wù)每次以0.2為梯度降低其信譽(yù)度(0.6→0.4→0.2→0)。圖7反映了信譽(yù)度對(duì)納什均衡帶寬的影響,從圖中可以看出,主服務(wù)2在幾個(gè)連續(xù)的算法周期中租出的頻譜帶寬迅速減少,而主服務(wù)1租出的頻譜帶寬緩慢增加,當(dāng)?shù)竭_(dá)第j+5個(gè)算法周期時(shí),主服務(wù)2租出的帶寬相比主服務(wù)1基本可以忽略不計(jì)。此外,由于偏好度與信譽(yù)度在數(shù)值上對(duì)認(rèn)可度的貢獻(xiàn)是相同的,因此若將仿真參數(shù)替換為偏好度,仍能得到與圖7相同的結(jié)果。從實(shí)際來看,次服務(wù)總是從具有更高信譽(yù)度/偏好度的主服務(wù)處租用更多頻譜,這種導(dǎo)向有利于優(yōu)化頻譜共享環(huán)境,并促成更加合理、有效的頻譜共享結(jié)果。
圖7 信譽(yù)度對(duì)納什均衡帶寬的影響
圖8 動(dòng)態(tài)博弈的穩(wěn)定區(qū)域和不穩(wěn)定區(qū)域
若兩個(gè)主服務(wù)的認(rèn)可度θi(i=1,2)分別為1和0.6,則納什均衡價(jià)格分別為1.13和0.82,圖9是頻譜價(jià)格的收斂過程,從圖中可以看出,動(dòng)態(tài)博弈最終收斂于納什均衡價(jià)格,并且收斂速度與學(xué)習(xí)因子αi的取值有關(guān),αi越小,收斂速度越快。合理設(shè)置αi的值可以使算法快速收斂,若學(xué)習(xí)因子過大,則策略調(diào)整過程中將出現(xiàn)波動(dòng),使得算法收斂速度減慢。
圖9 動(dòng)態(tài)博弈的迭代收斂過程
本文針對(duì)多主服務(wù)—單次服務(wù)的認(rèn)知頻譜共享場(chǎng)景,提出了基于認(rèn)可度的主服務(wù)博弈頻譜共享算法,并構(gòu)建了相應(yīng)的頻譜租賃框架。算法中考慮了頻譜水平差異下次服務(wù)的頻段選擇偏好和主服務(wù)的信譽(yù)度,在基于Bertrand博弈的頻譜共享模型中引入認(rèn)可度機(jī)制,得到了包含認(rèn)可度參數(shù)(偏好度參數(shù)和信譽(yù)度參數(shù))的新效用函數(shù),并通過在不同算法周期間動(dòng)態(tài)更新認(rèn)可度參數(shù)來優(yōu)化頻譜共享環(huán)境??紤]到在實(shí)際的頻譜共享環(huán)境中,博弈通常難以具備完全信息條件,本文將算法擴(kuò)展到了動(dòng)態(tài)博弈情形,并對(duì)其穩(wěn)定性進(jìn)行了分析。仿真實(shí)驗(yàn)結(jié)果表明該算法能實(shí)現(xiàn)更加合理、有效的頻譜共享。