摘 要: 針對無線電網(wǎng)絡中頻譜資源有限且利用率較低的問題,提出了基于雙向拍賣結(jié)合貝葉斯推理模型的頻譜共享算法。首先,主用戶和次用戶自適應地選擇拍賣價格分享頻段;然后,玩家基于反饋學習過程捕捉調(diào)整價格的策略;最后,進行重復拍賣過程直到達成共識。該算法采用了貝葉斯推理技術(shù),能夠自適應地響應不斷變化的系統(tǒng)環(huán)境和玩家數(shù)量,具有良好的可擴展性。仿真結(jié)果表明,該算法在PU受益、交易成功率、頻譜利用率、網(wǎng)絡吞吐量等方面顯著優(yōu)于其他幾種較新的頻譜共享算法。
關(guān)鍵詞: 貝葉斯模型; 分布式方式; 雙向拍賣; 認知無線電網(wǎng)絡; 頻譜共享
中圖分類號: TN926?34; TP393 文獻標識碼: A 文章編號: 1004?373X(2016)11?0024?06
Abstract: Since the spectrum resource in radio networks is limited and its utilization is low, a spectrum sharing algorithm for double auction combining Bayesian inference model is proposed. Firstly, the primary users and the secondary users adaptively select their auction prices to share the spectrum bands. And then, based on feedback learning process, the players capture their adjustable price strategies. Finally, the auction process is repeated until the consensus is reached. The algorithm adopts Bayesian inference technique, which can adaptively response to the constantly changing system environment and players′ quantity. It has better scalability. The simulation results show that the proposed algorithm is superior to several other advanced spectrum sharing algorithms in the aspects of PU benefit, trade success rate, spectrum efficiency and network throughput.
Keywords: Bayesian model; distributed mode; double auction; cognitive radio network; spectrum sharing
0 引 言
由于無線電頻譜的限制,通信網(wǎng)絡面臨頻譜資源稀缺的問題,另一方面,許多許可頻譜仍然長時間[1]未被占用。認知無線電(CR)可提高頻譜資源利用率,在CRs中,部分用戶可以智能地監(jiān)控環(huán)境并在分配的頻段都處于閑置狀態(tài)時能夠與許可用戶共享頻譜,通過許可用戶(PUs即主用戶)和未經(jīng)許可的用戶(SUs即次級用戶)[2]之間的頻譜共享實現(xiàn)CR網(wǎng)絡頻譜利用率的增加。
本文提出了一種基于雙向拍賣融合貝葉斯推理模型的頻譜共享算法,假設主用戶和次級用戶是自相關(guān)博弈玩家,他們?yōu)榱诉_到最大化收益的目的而做出決策。本文算法自適應地響應不斷變化的系統(tǒng)環(huán)境和玩家數(shù)量,具有良好的可擴展性,為了達成有效拍賣共識,本文算法適用于現(xiàn)實世界CR系統(tǒng)的操作,同時能盡可能高的保持頻譜效率。
1 相關(guān)研究
學者們提出了許多用于CRs中有效頻譜共享的拍賣博弈模型[3],可更為有效地解決有限稀有資源分配問題。拍賣博弈模型通過減少未分配的頻段數(shù)量可以提供更好的頻譜共享,提高了整體資源利用率[4]??。
文獻[5]中的戰(zhàn)略型頻譜拍賣(SPSA)方案是一種真實且計算高效的頻譜拍賣,支持類似eBay的動態(tài)頻譜市場,該方案允許無線用戶獲取并根據(jù)要求支付頻譜。此外,SPSA方案通過分配頻譜給最重視它的投標人能使頻譜所有者利潤最大化。然而,SPSA方案僅考慮購買者的單向頻譜拍賣,該SPSA方案可直接擴展為真實雙向頻譜拍賣(TDSA)方案[6]??,TDSA方案支持真實雙向頻譜拍賣,其中多方可根據(jù)個性化需求交易頻譜,該方案運用一種新的贏家確定和定價機制選擇獲勝買家和賣家,然而TDSA方案只假定簡單的頻譜需求/請求格式。文獻[7]中重復拍賣貝葉斯學習(RABL)方案建模為一個重復拍賣博弈,該方案研究了由監(jiān)控成本和訪問成本構(gòu)成的認知無線電系統(tǒng)的頻譜接入問題。因此,重復拍賣模式已用于最大限度地權(quán)衡訪問頻段的收益和成本。此外,為了設計一種具有不完整信息的方案,構(gòu)建了基于狄利克雷過程的非參數(shù)信念更新算法。文獻[8]中的自適應拍賣頻譜共享(AASS)方案是一種基于非合作博弈模型描述PUs和SUs之間競爭力的拍賣,該方案采用Hackner效用函數(shù)定義二次用戶的頻譜出價。此外,AASS方案為每個PU的成本函數(shù)提出了一種動態(tài)更新算法,這有助于在動態(tài)頻譜共享博弈的每個階段PUs從SUs實現(xiàn)更多的要求。文獻[9]中的基于雙向拍賣頻譜共享(DASS)方案是一種基于動態(tài)頻譜共享方案的雙向拍賣,該方案允許免費頻段在運營商之間交易,以提高頻譜利用率,DASS方案使用自適應調(diào)節(jié)投標/詢問策略研究實際的無線通信模型。
上述方案存在的主要問題有:首先,這些方案依賴于高復雜性和額外開銷,無法在現(xiàn)實的系統(tǒng)操作中實施,因此僅限于較小的網(wǎng)絡模型;其次,現(xiàn)有的方案不能自適應估計當前網(wǎng)絡條件,在動態(tài)網(wǎng)絡環(huán)境中可能造成潛在的錯誤決策;再次,這些方案有一些固定的系統(tǒng)參數(shù)操作網(wǎng)絡系統(tǒng),而在動態(tài)的網(wǎng)絡環(huán)境中,操作現(xiàn)實世界的網(wǎng)絡系統(tǒng)是不恰當?shù)姆椒?。受到上述討論的啟發(fā),本文提出了一種新的CR頻譜共享方案,將其設計為一個重復貝葉斯拍賣博弈。
2 提出的頻譜共享算法
2.1 博弈模型
博弈理論在無線網(wǎng)絡中可應用于資源分配[10]??,然而傳統(tǒng)的博弈模型假設任意玩家需要的所有信息都完全已知,這并不符合現(xiàn)實情況。基于此,傳統(tǒng)博弈模型不能直接應用于實際網(wǎng)絡運營,文獻[11]引入了貝葉斯博弈模型,該模型放寬了所有信息完全已知的假設,可以用于預測不確定性結(jié)果。
本文采用貝葉斯博弈方法解決CR系統(tǒng)中頻譜共享問題,貝葉斯模型由一組玩家、一組動作、玩家類型和每個玩家的效用函數(shù)等組成[12],提出的貝葉斯拍賣博弈如下:
玩家:CR系統(tǒng)中PUs和SUs,和 分別表示PU集合和SU集合,運行在頻帶上,其與PUs其他的頻帶不重疊,即。
動作集:任何都具有所有可能報價的集合,是預計出售頻段的價格。任何都具有所有可能出價的集合,這是可以支付的價格。
玩家類型:玩家的類型是一個概率分布,用來表達有關(guān)博弈玩家不確定或未知信息的概念,類型獨立且在重復拍賣階段動態(tài)變化,每個玩家完全知道自己的類型,而不知道其他玩家的類型,因此概率分布用于假設其他玩家的類型。
效用函數(shù):效用函數(shù)可量化玩家從特定結(jié)果獲得的滿意度,PUs的效用函數(shù)代表貨幣收益(即頻譜交易收入),對于SUs,拍賣價格越高,效益越低,因此SUs的效用函數(shù)定義為PUs的保留效用,如果PUs或SUs頻段交易失敗,該收益將保持0。
本文算法可歸結(jié)為一種重復博弈[13],該算法將時間軸劃分為等長度間隔(即) 。
2.2 雙向拍賣協(xié)議
傳統(tǒng)的拍賣主要涉及一個拍賣商(賣方)和多個投標人(買家),該結(jié)構(gòu)稱為單向拍賣,而在頻譜共享的拍賣場景中,存在幾個買家和賣家對頻段進行投標(即愿意支付的價格)及報價(即預期的銷售價格)的情況,該情況下的拍賣模式設計為多對多的雙向拍賣結(jié)構(gòu)。
模型中的系統(tǒng)操作員定義為拍賣商,負責定價和交易頻段。中PUs可以是賣方,賣家可以報價給拍賣商,以顯示其在價格上的偏好,中SUs可以是投標人,投標人投標購買頻段。每個玩家之間的頻譜拍賣(即PUs和SUs)周期性運行,對于每個拍賣階段,買賣雙方基于其效用函數(shù)估計頻段價值,當所有的報價和出價送到拍賣商之后,拍賣商設置頻譜共享交易價格,并決定哪個投標人從哪個賣家獲得頻段。采用普雷斯頓?邁克菲雙向拍賣(Preston?McAfee Double Auction,PMDA)協(xié)議的基本概念決定商品價格,在每一輪拍賣結(jié)束后,拍賣商收集所有有關(guān)報價和出價的信息,并通過分類和匹配技術(shù)[14]決定交易價格,然后拍賣商對所有玩家宣布決定的商品價格,因此,玩家學習CR系統(tǒng)中當前頻譜共享條件,SUs(即投標人)獲得所需頻段,在接下來的一輪拍賣不會提交新出價,如果一些SUs競標頻段失敗,他們將提交新的出價給拍賣商,同時,如果一些PUs沒有售出自己的頻段,他們在下次拍賣時也將提交新的報價。因此,在每一輪拍賣中,剩下的玩家自適應地調(diào)整自己的價格,這種動態(tài)的拍賣程序依次重復每一個(即串行拍賣),以達成有效拍賣共識。
2.3 貝葉斯推理和學習
貝葉斯博弈模型中,玩家學習修改自己的先驗知識并自適應地調(diào)整策略。該方法并不假定玩家總是根據(jù)完整信息作出最佳決策,貝葉斯博弈的過程中,玩家有機會重新考慮目前的策略和應對以最大化期望收益,因此它提供了真實世界環(huán)境下更現(xiàn)實的模型。
玩家對頻譜交易的渴望度強烈影響玩家的出價方案,通常情況下,玩家不知道其他玩家的愿望,但它實際上隱藏在每一輪拍賣中拍賣商的交易價格中。為了提交新的買價和賣價,買賣雙方推斷出下一輪交易價,這稱為拍賣商類型。在每一輪拍賣中,玩家可以通過拍賣商的建議了解到別人的出價信息,基于該推論,每個玩家都可以為下一次拍賣做出更好的價格決策。
貝葉斯學習方法用來推斷他人的渴望水平,根據(jù)貝葉斯定理和更新規(guī)則,貝葉斯推理公式[13]如下所示:
2.4 本文算法的主要步驟
通過使用貝葉斯博弈模型為CR系統(tǒng)設計了一個新的頻譜共享方案。提出的方案中,PUs和SUs(即博弈玩家)自適應地選擇自己的拍賣價格分享頻段。基于反饋學習過程,玩家可以捕捉如何調(diào)整自己的價格策略,為達成共識,該過程制定為重復拍賣模型。每一輪拍賣結(jié)束后,玩家定期檢查目前的交易價格,并以完全分布式的方式迭代調(diào)整價格,因此玩家的數(shù)量增加時計算復雜度不會顯著增加,這種交互式反饋過程持續(xù)進行,直到達成共識。提出的頻譜共享算法的流程圖如圖1所示,主要步驟如下:
步驟1:初始迭代(),每個拍賣商渴望水平的初始概率為均勻分布(其中是時間間隔的總數(shù))。
步驟2:每次拍賣階段,頻譜賣家和頻譜買家發(fā)送報價和出價給拍賣商。
步驟5:賣家提供的價格比T_P低,買家出價高于T_P,以T_P價格成功交易頻段。
步驟6:拍賣商宣布目前T_P,并發(fā)送拒絕消息給當前一輪拍賣交易頻段都不成功的賣家和投標人。
步驟7:以分布式方式,交易失敗的賣家和投標人通過式(2)~式(7)動態(tài)調(diào)整拍賣價格。
步驟8:如果至少有一個賣方、一個投標人提交新的報價和出價,則轉(zhuǎn)到步驟3進行下一輪拍賣,該迭代反饋過程一直持續(xù)到賣家和投標人達成共識,否則,進入終止步驟。
終止:拍賣博弈處理時間暫時結(jié)束,而CR系統(tǒng)持續(xù)自我監(jiān)控,當新的頻譜共享要求(即報價和出價)到達,它可以重新觸發(fā)頻譜共享算法。
3 仿真實驗
進行仿真實驗評估本文算法的性能,將本文算法與其他現(xiàn)有方案的性能做比較,并確認了本文算法的性能優(yōu)勢,為了確保該模型充分通用且在真實世界有效,假設如下:
(1) 新的應用程序請求服務生成過程服從速率為(服務/秒)的泊松分布,提供的負載變化范圍從0~3.0;
(2) CR系統(tǒng)的總頻譜容量為5 Mb/s;
(3) 基于50次模擬運行獲得的結(jié)果,系統(tǒng)性能測量值繪制為每秒提供負載的函數(shù);
(4) 中PU總數(shù)為30,中SU總數(shù)為15;
(5) 通過模擬獲得的性能標準為PUs的收益、交易成功概率、頻譜利用率、系統(tǒng)吞吐量、SUs請求阻塞概率、平均每輪拍賣次數(shù)等;
(6) 頻譜利用率定義為歸一化的頻譜效率,該值基于網(wǎng)絡傳輸數(shù)據(jù)量進行測量;
(7) PUs的收益為頻譜共享總價格;
(8) 網(wǎng)絡吞吐量為歸一化值,為成功提供服務數(shù)據(jù)量與總數(shù)據(jù)量比值;
(9) 為了表示各種多媒體應用,假設有四個不同的通信類型,基于連接的持續(xù)時間、頻譜需求和QoS要求,它們以相同的概率生成;
(10) 對于不同的多媒體運用,應用程序服務的持續(xù)時間服從不同均值的指數(shù)分布。
對于多個應用程序,每個服務具有不同的流量特性,為了模擬真實的網(wǎng)絡并進行公平的比較,本文使用現(xiàn)實模擬模型中給定的應用類型、特性和系統(tǒng)參數(shù)。表1為模擬中使用的多媒體應用程序類型和系統(tǒng)參數(shù)。
將本文算法與三個現(xiàn)有方案:RABL方案[1],AASS方案[6],DASS方案[7]的性能進行比較。
圖2顯示了所有方案的PUs總收益,從主用戶角度看,收益是一個非常重要的因素,結(jié)果表明,應用程序請求率非常低(<0.4)時,所有方案收入幾乎相同。而當請求速率增加時,本文算法的PUs收益比其他方案更好。
圖3給出了SUs服務阻塞率方面的性能比較,從次級用戶的角度來看,服務阻塞概率是一個關(guān)鍵問題。由于適應性共享機制,本文提出的方案可避免頻譜浪費,在各種流量負荷強度下,本文提出的方案可以提供比其他方案更低的服務阻塞率,這在實際網(wǎng)絡運營中非常有用。
圖4是系統(tǒng)吞吐量的比較,一旦應用程序服務完成,該服務的總傳輸速率即為系統(tǒng)的吞吐量。在服務連接中間沒有增益累計的拒絕或終止服務,當服務請求速率增加時,拒絕服務的數(shù)量增加,則CR系統(tǒng)的吞吐量降低?;谧赃m應頻譜共享策略,本文算法比其他方案更好地提高了系統(tǒng)的吞吐量。
圖5顯示了各種方案的頻譜利用率,為了最大化系統(tǒng)性能,頻譜利用率是一個重要的性能指標,所有的方案都有類似的趨勢,而在各種請求速率下,本文提出的方案的頻譜利用率比其他方案更好。
圖6比較了各種方案中交易成功概率方面的性能。在不同系統(tǒng)負載情況下,本文算法比其他方案具有更好的成功概率,這確保本文算法能夠提供一個有效的拍賣機制以共享頻譜資源。
圖7給出了各種方案平均拍賣輪數(shù),拍賣輪數(shù)是指每輪拍賣頻譜交易的平均數(shù)量,所有方案趨勢類似,然而,基于貝葉斯學習過程的智能方法可以使拍賣模式更加適應當前的系統(tǒng)狀況,因此本文算法可以比其他方案保持較低的拍賣輪數(shù)。
從圖2~圖7的模擬結(jié)果可以看出,在一般情況下,本文算法在多樣化系統(tǒng)負荷強度下比其他現(xiàn)有算法更好。本文算法始終監(jiān)視當前系統(tǒng)狀態(tài),且靈活度高、適應性強,能夠感應到動態(tài)變化的系統(tǒng)環(huán)境,有顯著的性能改進和更好的系統(tǒng)收益。因此,本文算法可以保持均衡的系統(tǒng)性能。
4 結(jié) 語
本文提出了一種新的頻譜共享算法,將其設計為一種重復貝葉斯拍賣博弈,在不具有完整信息的情況下,PUs和SUs通過貝葉斯學習過程自適應決定報價或出價。拍賣過程周期性進行,直到達成共識。由于自相關(guān)特性,價格調(diào)整決策以完全分布式方式進行,在現(xiàn)實世界系統(tǒng)操作中,該分布式控制方式是最終實現(xiàn)的適應方法。本文算法具有較好的適應性、可行性和有效性,能平衡系統(tǒng)的性能。仿真結(jié)果表明,本文算法在PU受益、交易成功率、頻譜利用率、網(wǎng)絡吞吐量等方面顯著優(yōu)于現(xiàn)有方案。
本文算法可在無線開放存取研究平臺上對資源利用率要求較高的網(wǎng)絡應用程序進行測試,未來工作可通過研究噪聲控制信道中的誤差修正技術(shù)提高認知無線電網(wǎng)絡的系統(tǒng)性能。
參考文獻
[1] 邱晶,周正.認知無線電網(wǎng)絡中的分布式動態(tài)頻譜共享[J].北京郵電大學學報,2009,32(1):69?72.
[2] LI D, XU Y, LIU J, et al. A market game for dynamic multi?band sharing in cognitive radio networks [C]// 2010 IEEE International Conference on Communications. Cape Town: IEEE, 2010: 1?5.
[3] 王欽輝,葉保留,田宇,等.認知無線電網(wǎng)絡中頻譜分配算法[J].電子學報,2012,40(1):147?154.
[4] 劉甲.認知無線傳感器網(wǎng)絡中頻譜共享技術(shù)的研究[D].北京:北京郵電大學,2013.
[5] WU F, VAIDYA N. A strategy?proof radio spectrum auction mechanism in noncooperative wireless networks [J]. IEEE tran?sactions on mobile computing, 2013, 12(5): 885?894.
[6] 黃河,孫玉娥,陳志立,等.完全競爭均衡的頻譜雙向拍賣機制研究[J].計算機研究與發(fā)展,2014,51(3):479?490.
[7] 張麗影,曾志文,陳志剛,等.認知無線網(wǎng)絡中基于約束算子的二進制粒子群頻譜分配算法[J].小型微型計算機系統(tǒng),2013,34(6):1226?1229.
[8] LOUIE R H Y, MCKAY M R, CHEN Y. Multiple?antenna signal detection in cognitive radio networks with multiple primary user signals [C]// 2014 IEEE International Conference on Communications. Sydney: IEEE, 2014: 4951?4956.
[9] WANG S G, XU P, XU X H, et al. TODA: truthful online double auction for spectrum allocation in wireless networks [C]// 2010 IEEE Symposium on New Frontiers in Dynamic Spectrum. Singapore: IEEE, 2010: 1?10.
[10] 齊麗娜,房志強.一種改進的基于動態(tài)貝葉斯博弈的主用戶頻譜策略[J].南京郵電大學學報(自然科學版),2013,33(5):1?6.
[11] 王臣昊,楊震,肖小潮.基于優(yōu)化貝葉斯壓縮感知算法的頻譜檢測[J].信號處理,2012,28(5):750?756.
[12] HAN Z, ZHENG R, POOR H V. Repeated auctions with Bayesian nonparametric learning for spectrum access in cognitive radio networks [J]. IEEE transactions on wireless communications, 2011, 10(3): 890?900.
[13] AKKARAJITSAKUL K, HOSSAIN E, NIYATO D. Distribu?ted resource allocation in wireless networks under uncertainty and application of Bayesian game [J]. IEEE communications magazine, 2011, 49(8): 120?127.
[14] 李士濤.認知無線電網(wǎng)絡中的動態(tài)信道分配技術(shù)研究[D].重慶:重慶大學,2014.
[15] GARG S K, VENUGOPAL S, BROBERG J, et al. Double auction?inspired meta?scheduling of parallel applications on global grids [J]. Journal of parallel and distributed computing, 2013, 73(4): 450?464.