亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

一種動態(tài)頻譜分配的多層博弈模型構(gòu)建分析*

2022-08-01 02:18:12杜海龍張衛(wèi)黨

電訊技術(shù) 2022年7期

杜海龍，邵霞，張衛(wèi)黨

(1.鄭州西亞斯學(xué)院電子信息工程學(xué)院,鄭州 451150;2.華北水利水電大學(xué) 物理與電子學(xué)院,鄭州 450046;3.鄭州大學(xué) 信息工程學(xué)院,鄭州 450001)

0 引言

無線通信需要大量的頻譜資源作為支撐。在傳統(tǒng)的頻譜資源管理上，各國無線電管理部門均采用頻譜固定分配機(jī)制。一方面，隨著物聯(lián)網(wǎng)、5G網(wǎng)絡(luò)等技術(shù)的發(fā)展和應(yīng)用，頻譜資源顯得日益緊俏，頻譜固定分配的弊端日益凸顯[1-2]；另一方面，頻譜所有者對其所占有的頻譜的使用在時間和空間上都是不連續(xù)的，固定分配的頻譜即使在空閑的時間和地區(qū)也不能被其他用戶所使用，頻譜資源利用不平衡現(xiàn)象突出[3-4]。固定頻譜分配機(jī)制極大地限制了無線通信技術(shù)的發(fā)展，探索新的頻譜資源的分配方式已迫在眉睫。隨著認(rèn)知無線電技術(shù)的出現(xiàn)和發(fā)展，多個國家已允許對利用率較低的電視廣播頻段(450～806 MHz)進(jìn)行頻譜動態(tài)管理和動態(tài)分配，即通過讓網(wǎng)絡(luò)節(jié)點根據(jù)業(yè)務(wù)需求動態(tài)接入頻譜資源，來提高頻譜利用率。

近年來，圍繞著動態(tài)頻譜分配，國內(nèi)外相關(guān)學(xué)者開展了廣泛而深入的研究。 2020年，Sofia等[5]提出了一種基于拍賣機(jī)制的動態(tài)頻譜分配策略，在定價策略的基礎(chǔ)上，建立了新的操縱多贏家拍賣機(jī)制的框架；同年，于永生等[6]在多個主服務(wù)和單個次服務(wù)的頻譜共享模式下提出了一種基于認(rèn)可度的主服務(wù)博弈頻譜共享算法；2021年，韓志豪[7]等提出了一種應(yīng)用于超密集網(wǎng)絡(luò)的基于博弈論的頻譜分配策略，分析了對圖論著色算法和頻譜隨機(jī)分配算法的性能。

本文基于隨機(jī)幾何和博弈論相結(jié)合的方法，構(gòu)建了一個多層的博弈模型，研究移動網(wǎng)絡(luò)運營商的帶寬分配策略制定以及用戶對于移動網(wǎng)絡(luò)運營商的選擇問題。

1 多層博弈結(jié)構(gòu)

本文假定用戶和移動網(wǎng)絡(luò)運營商(Wireless Service Provider,WSP)都是自私的，都會希望謀求自己的利益最大化，單個用戶都會選擇合適的WSP來獲得最大的收益；同樣，WSP都希望通過制定適當(dāng)?shù)念l譜分配策略來爭取盡可能多的用戶以此來盡可能提高自己的利潤；每個用戶在選擇特定的WSP之后，收益便由選擇服務(wù)的價格以及其期望傳輸功率所共同決定。

同時，用戶的期望傳輸功率還由選擇同一種網(wǎng)絡(luò)的用戶數(shù)量(其他用戶的行為)以及該種網(wǎng)絡(luò)所占有的頻譜帶寬(WSP的行為)決定，選擇同一種網(wǎng)絡(luò)的用戶越多，該種網(wǎng)絡(luò)用戶的期望傳輸速率就越低，相應(yīng)地，收益就會越低。同時，WSP也需要充分考慮其他競爭對手的行為以及用戶的行為來制定合適的頻譜分配策略。因此，所研究的場景之中存在用戶之間以及WSP之間兩個層面的競爭，并且這兩種競爭存在一種循環(huán)依賴性。在上述交互過程中，不同種類用戶行為之間也存在潛在影響。具體來說，偏好一種服務(wù)的用戶不會影響偏好其他服務(wù)的用戶對于WSP之間的選擇，但是會對加入市場競爭的WSP產(chǎn)生影響。這會影響WSP的帶寬分配策略，從而可以影響所有人群的WSP選擇行為。

兩種競爭和其中的循環(huán)依賴可以由圖1的多層框架來表示。本文應(yīng)用三種博弈框架來解決其中的內(nèi)部關(guān)聯(lián)問題，在圖1框架底層，將不同用戶之間對于WSP選擇的競爭構(gòu)造為一個演化博弈，通過長期的博弈，可以達(dá)到使所有用戶都收獲相同收益的演化均衡；在框架上層，將不同WSP之間的競爭構(gòu)造為一個關(guān)于帶寬的非合作博弈。此外，本文將用戶和WSP的行為之間的內(nèi)部依賴構(gòu)造為一個多領(lǐng)導(dǎo)者多跟隨者的Stackelberg博弈，其中，無線網(wǎng)絡(luò)提供商是領(lǐng)導(dǎo)者，用戶是跟隨者。通過向后歸納法，可以求解Stackelberg博弈問題，通過充分考慮用戶在達(dá)到演化均衡時的行為來制定合適的頻譜分配策略。因此，對于每個WSP，需要解決的主要問題就是如何準(zhǔn)確估計用戶的均衡行為，換言之，依次解決提出的演化博弈和非合作博弈問題，即可解決Stackelberg博弈問題。

圖1 多層博弈框架圖

2 用戶期望平均速率

(1)

(2)

(3)

(4)

(5)

(6)

(7)

式中：NS表示每個結(jié)點中的平均用戶數(shù)量；xS表示一個用戶從WSPn中獲取服務(wù)k的概率，也是該人群中選擇從WSPn中獲取服務(wù)k的用戶的比例。下面分析中，xS將用來表示演化博弈中的人口占比。

3 演化博弈模型構(gòu)建

本文將用戶的WSP選擇行為構(gòu)造為一個演化博弈，該博弈最初用于生物學(xué)研究動物種群演化，然后在經(jīng)濟(jì)學(xué)中用于模擬人類的行為，近年來被用來研究無線通信中的工程問題[11-13]。

用回報函數(shù)來量化一個用戶對于其所選的網(wǎng)絡(luò)的滿意程度，本文采用式(8)來描述：

(8)

整個種群用戶的平均收益為

(9)

從回報函數(shù)可得，用戶的實際收益不僅受到其選擇的WSP的策略的影響(WSP的行為)，還受到與其選擇同一個WSP的用戶的比例(其他用戶的行為)的影響。在WSP的頻譜分配策略前提下，xak越大，該策略下的用戶的收益越少。

本算法設(shè)計中存在一個集中控制器來維護(hù)來自同一區(qū)域的所有用戶的支付信息，每個用戶的網(wǎng)絡(luò)選擇決定基于其當(dāng)前收益和同一區(qū)域中的所有用戶的平均收益?？紤]到收益低于平均收益用戶肯定要轉(zhuǎn)向選擇其策略空間中的其他選項，但現(xiàn)實中，收益低的人群中，伴隨著用戶的逐漸轉(zhuǎn)移，剩余用戶的收益在逐漸升高，且其他策略中的用戶利益在逐漸降低。因此，收益低的人群不會短時間全部轉(zhuǎn)向其他策略。用戶之間競爭的演化博弈具體算法(算法1)的偽代碼如下：

2 初始化：將幾個種群的用戶平均分配到幾個WSP中，計算此時的用戶狀態(tài)。

3 計算各個種群的用戶的期望速率。

4 loop:

5 每個用戶計算此時的收益，并將結(jié)果上傳中心節(jié)點。

6 中心節(jié)點計算整個種群的平均收益，并將結(jié)果返回各用戶。

7 對每個用戶：

該用戶隨機(jī)選擇收益高于當(dāng)前收益的策略

end if

end loop當(dāng)一個種群中的所有用戶都得到相同的收益

10 輸出：各個種群的用戶的收益πk,k∈K

4 WSP之間的非合作博弈

經(jīng)過分析Stackelberg博弈模型中追隨者(即用戶)的行為并引入演化博弈理論算法，推斷出了當(dāng)用戶獲取到Stackelberg博弈模型中的領(lǐng)導(dǎo)者(即WSP)的頻譜分配策略之后的最佳反應(yīng)，并達(dá)到整體利益最大化。基于上文得到的用戶達(dá)到的演化均衡狀態(tài)，下面通過非合作博弈理論來研究單個領(lǐng)導(dǎo)者(WSP)如何制定合適的頻譜分配策略。

為了競爭得到最大市場份額以獲取更高收益，移動網(wǎng)絡(luò)運營商需要正確分配所占頻譜，每個WSP需要根據(jù)用戶的均衡狀態(tài)來制定自己的頻譜分配方案[14-15]。因此，將WSPn所獲得的收益函數(shù)定義為其所提供的各種服務(wù)k所占有的用戶數(shù)量與定價的乘積，表示為

(10)

WSP的收益取決于本身及其他WSP的頻譜分配策略。假設(shè)各WSP可以通過市場調(diào)查等方式獲取競爭對手的部分網(wǎng)絡(luò)部署參數(shù)，如基站密度及傳輸功率等，但不能精確掌握全部頻譜分配策略。因此，本文將WSP之間的競爭構(gòu)造為一個非合作的頻譜分配博弈模型。

對于WSPn，其策略空間為可獲得的頻譜分配方案：

(11)

當(dāng)給定策略配置文件(Bn)n∈N=(B1,B2,…,BN)∈(Bn)n∈N時，WSPn的收益函數(shù)為

(12)

對非合作博弈，通常用納什均衡代表其均衡狀態(tài)。在納什均衡下，沒有WSP可通過改變策略來單方面提高其收益。例如，若WSPn降低了其提供的各個服務(wù)定價，短時間內(nèi)其用戶收益必然升高，也會吸引更多用戶。但其他WSP為了保證市場份額會同樣在價格上進(jìn)行調(diào)整，隨著演化，WSP之間會達(dá)到新的平衡狀態(tài)，但因為整體的價格都有所降低，各個WSP在新平衡中的收益也隨之降低。

(13)

其中：

(14)

本文提出的非合作博弈模型納什均衡的離線迭代算法(算法2)偽代碼如下：

2 repeat:

3 令t=t+1，且Bn(t)=Bn(t-1)

4 forn=1到N的用戶

6 end for

7 until式(15)的終止條件被滿足。

8 if在迭代過程中出現(xiàn)Bn,k(t)

在每一個循環(huán)過程中，首先通過式(14)計算拉普拉斯乘子，然后更新各個WSP的分配方案，當(dāng)兩次連續(xù)的迭代結(jié)果Bn(t-1)和Bn(t)之間的差異足夠小時，循環(huán)終止，終止標(biāo)準(zhǔn)為

(15)

因為本文提出的算法2是一個離線算法，在實踐中，每一個WSP均可獨立實施，且當(dāng)給定一個共同的初始點時，例如在初始化過程中將頻譜均勻分配到各個網(wǎng)絡(luò)層，那么算法可以收斂到納什均衡狀態(tài)。

5 仿真分析

本文利用Matlab2021a平臺，基于算法1對用戶選擇WSP的演化博弈進(jìn)行了仿真分析，用戶種群數(shù)和WSP數(shù)設(shè)置為2，每個種群中用戶數(shù)為2 000，演化次數(shù)為100，結(jié)果如圖2～5所示。圖2和圖3分別為P1種群和P2種群中每個WSP擁有的客戶數(shù)量的變化，圖4和圖5為P1和P2兩個種群中選擇各個WSP的用戶收益變化情況。由圖2和圖3可以看出，經(jīng)過大約10次演化之后，P1種群和P2種群中對WSP選擇的用戶數(shù)均可以達(dá)到演化均衡狀態(tài)。由圖4和圖5可以看到，當(dāng)總體都達(dá)到平衡狀態(tài)時，無論從哪個WSP獲取服務(wù)，每個種群中所有用戶都將獲得相同的收益，這個結(jié)果也意味著穩(wěn)定的市場中任何用戶都無法通過單方面更改決策來獲得更高的收益。

圖2 P1種群中的WSP占有用戶數(shù)量的動態(tài)演化

圖3 P2種群中WSP占有用戶數(shù)量的動態(tài)演化

圖4 P1種群中選擇各個WSP的用戶的收益演化

圖5 P2種群中選擇各個WSP的用戶的收益演化

為了證明算法1演化均衡的穩(wěn)定性，我們模擬突變場景，在第40次演化過程中，令P1和P2種群中不同WSP的用戶發(fā)生突變，設(shè)置用戶組中各有200個轉(zhuǎn)變WSP選擇策略。由結(jié)果圖可以看出，由于這種突變破壞了WSP之間的負(fù)載平衡，同一個種群中有一個用戶組收益增加，另一個用戶組相應(yīng)收益減少，但又經(jīng)過一定次數(shù)的演化后，又重新回到了之前達(dá)到的演化穩(wěn)定狀態(tài)，這就證明了算法1演化均衡的漸進(jìn)穩(wěn)定性，也證明了演化平衡狀態(tài)具有唯一性。因此，每個WSP根據(jù)用戶的演化均衡狀態(tài)來評估市場的份額并依次合理地進(jìn)行頻譜分配并部署基站的策略是可行的。

為了證明算法2非合作博弈模型穩(wěn)定狀態(tài)的唯一性，我們對WPS1和WPS2各10組獨立隨機(jī)的初始點進(jìn)行了模擬仿真，迭代次數(shù)設(shè)置為10，結(jié)果如圖6和圖7所示?？梢钥闯?，經(jīng)過4～5次迭代之后，系統(tǒng)達(dá)到穩(wěn)定狀態(tài)，這就說明無論具有什么樣的初始狀態(tài)，每個WSP最終都將采用相同的策略來獲取最大收益，即納什均衡是唯一的。

圖6 WSP1帶寬分配策略演化

圖7 WSP2帶寬分配策略演化

6 結(jié) 論

本文通過采用隨機(jī)幾何和博弈論相結(jié)合的方法[16]構(gòu)建了一個多層博弈框架模型來模擬用戶和WSP之間的復(fù)雜交互，研究了用戶對于移動網(wǎng)絡(luò)運營商的選擇，以及移動網(wǎng)絡(luò)運營商在無線蜂窩網(wǎng)絡(luò)中的動態(tài)頻譜分配策略制定等問題。仿真結(jié)果表明，用戶選擇WSP行為最終會達(dá)到演化均衡狀態(tài)，且這種演化均衡狀態(tài)具有漸近穩(wěn)定性和唯一性；WSP之間競爭方面，通過定義多組初始點，無論最初是什么狀態(tài)，每個WSP最終都會采取相同的策略，這就證明了非合作博弈模型中納什均衡的存在及其唯一性；同時，仿真結(jié)果還體現(xiàn)了基站密度以及用戶密度對WSP帶寬分配策略的影響。