張超,董穎,呂楊,蘇真真
?
基于重復(fù)博弈的WSN節(jié)點(diǎn)合作性研究
張超,董穎,呂楊,蘇真真
(吉林大學(xué)通信工程學(xué)院,吉林長(zhǎng)春,130012)
將博弈論引入節(jié)點(diǎn)行為的決斷中,在網(wǎng)絡(luò)中建立1個(gè)基于節(jié)點(diǎn)數(shù)據(jù)傳輸可靠度的重復(fù)博弈模型。針對(duì)節(jié)點(diǎn)的行為引入最優(yōu)懲罰程度的懲罰機(jī)制,在保證對(duì)自私節(jié)點(diǎn)產(chǎn)生足夠震懾的同時(shí),又避免對(duì)自私節(jié)點(diǎn)過度懲罰而造成節(jié)點(diǎn)的提早死亡,從而提升網(wǎng)絡(luò)數(shù)據(jù)傳輸?shù)恼w效益。研究結(jié)果表明:采取最優(yōu)懲罰輪數(shù)的懲罰策略能夠在保證最少的減小網(wǎng)絡(luò)生命周期的前提下,最大程度地提升網(wǎng)絡(luò)的整體效益約22.83%。
無線傳感器網(wǎng)絡(luò);能量均衡;路由;重復(fù)博弈;理性偏好
無線傳感器網(wǎng)絡(luò)(wireless sensor network,WSN)作為物聯(lián)網(wǎng)研究的一個(gè)重要組成部分吸引了大量科研工作者的關(guān)注。WSN由眾多具有自我控制、感知、數(shù)據(jù)處理和無線通信能力的無線傳感器節(jié)點(diǎn)通過自組織的方式構(gòu)成[1?3]。由于WSN中節(jié)點(diǎn)的能量有限[4],使得部分節(jié)點(diǎn)會(huì)以節(jié)省自身能量為主導(dǎo)而選擇自私行為[5],拒絕轉(zhuǎn)發(fā)其他節(jié)點(diǎn)的數(shù)據(jù)包,從而造成整個(gè)網(wǎng)絡(luò)吞吐量迅速下降。如何有效規(guī)范WSN內(nèi)節(jié)點(diǎn)的行為,在盡可能保證網(wǎng)絡(luò)能耗均衡的前提下提升網(wǎng)絡(luò)的吞吐量成為WSN研究的一個(gè)重要內(nèi)容。博弈論是研究不同決策主體間決策均衡的理論[6],因此利用博弈論規(guī)范WSN中節(jié)點(diǎn)的行為就成為解決網(wǎng)絡(luò)能耗均衡問題的有效手段[7]。近年來,利用博弈論處理無線網(wǎng)絡(luò)能耗問題得到了較多的應(yīng)用。王博等[8]建立了Ad Hoc無限重復(fù)合作轉(zhuǎn)發(fā)博弈模型, 結(jié)合該模型提出了激勵(lì)節(jié)點(diǎn)之間合作的積極性條件,并給出了一種通用的懲罰機(jī)制。JAMIN等[9]運(yùn)用博弈理論在無線傳感器網(wǎng)絡(luò)中提出了一種高效的路由算法,整個(gè)過程被建模為一個(gè)動(dòng)態(tài)的、合作的不完全信息博弈,根據(jù)信號(hào)干擾噪聲比確定最優(yōu)路徑,并定義一個(gè)效用函數(shù),在能量消耗和延遲之間實(shí)現(xiàn)平衡。LI等[10]構(gòu)建了基于進(jìn)化博弈的WSN信任策略模型,通過動(dòng)態(tài)分析進(jìn)化穩(wěn)定狀態(tài)的定理和推論,給出了信任激勵(lì)和數(shù)據(jù)重傳的上限。LIU[11]考慮到節(jié)點(diǎn)希望其他節(jié)點(diǎn)轉(zhuǎn)發(fā)自身信息,并盡量避免中繼傳輸其他節(jié)點(diǎn)的信息,導(dǎo)致節(jié)點(diǎn)表現(xiàn)出自私性,為避免這種情況發(fā)生,在WSN中引入非合作競(jìng)爭(zhēng)均衡,每個(gè)節(jié)點(diǎn)都要經(jīng)過競(jìng)爭(zhēng)以實(shí)現(xiàn)數(shù)據(jù)傳輸,達(dá)到網(wǎng)絡(luò)性能的提升。以上研究表明,在WSN中通過引入博弈論來規(guī)范節(jié)點(diǎn)行為是有效的,利用懲罰自私節(jié)點(diǎn)既可以均衡網(wǎng)絡(luò)能耗,又能夠提升網(wǎng)絡(luò)的吞吐量。但是,節(jié)點(diǎn)自私行為的程度各不相同,某些節(jié)點(diǎn)可能持續(xù)采取自私行為,而某些節(jié)點(diǎn)只是偶爾采取自私行為。因此,研究根據(jù)節(jié)點(diǎn)行為的自私程度不同而采取最優(yōu)的懲罰措施是非常必要的?;诖耍疚淖髡呓⒘嘶谥貜?fù)博弈的分層WSN模型,選擇最優(yōu)懲罰程度的機(jī)制,既保證對(duì)節(jié)點(diǎn)產(chǎn)生足夠震懾,又不會(huì)對(duì)節(jié)點(diǎn)造成損害,從而實(shí)現(xiàn)在保證網(wǎng)絡(luò)生命周期的同時(shí),最大程度地提升網(wǎng)絡(luò)的整體性能。
WSN的層次結(jié)構(gòu)能夠提高節(jié)點(diǎn)的能量效率、改善WSN的可擴(kuò)展性和有效地利用網(wǎng)絡(luò)資源,如圖1所示,因此本文基于層次網(wǎng)絡(luò)結(jié)構(gòu)建立重復(fù)博弈的模型。整個(gè)網(wǎng)絡(luò)可分為若干簇,每簇內(nèi)包含若干簇內(nèi)節(jié)點(diǎn)和1個(gè)簇頭節(jié)點(diǎn),簇內(nèi)節(jié)點(diǎn)與網(wǎng)絡(luò)中其他簇節(jié)點(diǎn)的通信必須通過簇頭節(jié)點(diǎn),由簇頭節(jié)點(diǎn)將數(shù)據(jù)轉(zhuǎn)發(fā)到Sink節(jié)點(diǎn)[12]。網(wǎng)絡(luò)的工作過程包括簇頭節(jié)點(diǎn)的選擇過程和數(shù)據(jù)的傳送過程[13?14],為方便分析,本文建立了1個(gè)理想的WSN網(wǎng)絡(luò)模型,該網(wǎng)絡(luò)應(yīng)具有以下性質(zhì):
圖1 網(wǎng)絡(luò)模型
1) 網(wǎng)絡(luò)中節(jié)點(diǎn)的分布是不均勻的,且每個(gè)節(jié)點(diǎn)具有唯一的ID,節(jié)點(diǎn)具有完全理性[15],完全可以按照自己的意愿進(jìn)行策略選擇以實(shí)現(xiàn)自身效益的最大化;
2) 節(jié)點(diǎn)一旦布置完成,能量有限且不能補(bǔ)給;
3) 網(wǎng)絡(luò)的運(yùn)行時(shí)間可劃分成若干相等的時(shí)隙,即釆用離散時(shí)間模型,使用TDMA模式發(fā)送數(shù)據(jù),且假設(shè)每個(gè)時(shí)隙每節(jié)點(diǎn)只發(fā)送1次數(shù)據(jù)包。
4) 假設(shè)節(jié)點(diǎn)發(fā)送或者轉(zhuǎn)發(fā)1個(gè)數(shù)據(jù)包所消耗的能量是固定的。
2.1 階段博弈與重復(fù)博弈
WSN中節(jié)點(diǎn)理性偏好的設(shè)計(jì)是決定博弈模型能否成功的關(guān)鍵性因素[16],源節(jié)點(diǎn)數(shù)據(jù)能否成功傳送到Sink節(jié)點(diǎn)以及數(shù)據(jù)傳輸過程中的能耗問題則是影響網(wǎng)絡(luò)性能最關(guān)鍵的2個(gè)因素,所以,本文基于這2個(gè)因素對(duì)節(jié)點(diǎn)的理性偏好進(jìn)行設(shè)定。
博弈參與者:在分簇路由協(xié)議中將節(jié)點(diǎn)分為簇內(nèi)節(jié)點(diǎn)與簇頭節(jié)點(diǎn)2類。簇內(nèi)節(jié)點(diǎn)負(fù)責(zé)數(shù)據(jù)的發(fā)送,簇頭節(jié)點(diǎn)在完成數(shù)據(jù)發(fā)送的同時(shí)還要進(jìn)行數(shù)據(jù)的轉(zhuǎn)發(fā)任務(wù)。節(jié)點(diǎn)的自私行為(即不轉(zhuǎn)發(fā)數(shù)據(jù))主要是發(fā)生在簇頭節(jié)點(diǎn)處,因而本模型建立的是針對(duì)簇頭節(jié)點(diǎn)是否轉(zhuǎn)發(fā)簇內(nèi)節(jié)點(diǎn)數(shù)據(jù)而進(jìn)行的博弈。故在該模型中將博弈者設(shè)為簇頭節(jié)點(diǎn),由于簇頭節(jié)點(diǎn)每輪是隨機(jī)變化的,每個(gè)節(jié)點(diǎn)都有可能當(dāng)選為簇頭節(jié)點(diǎn),所以,從博弈整體來看,博弈參與者即為網(wǎng)絡(luò)中所有的傳感器節(jié)點(diǎn)。
參與者策略空間:針對(duì)本文中節(jié)點(diǎn)理性偏好的設(shè)定,簇頭節(jié)點(diǎn)的策略選擇是對(duì)是否轉(zhuǎn)發(fā)簇內(nèi)節(jié)點(diǎn)的數(shù)據(jù)包到Sink節(jié)點(diǎn)與能耗問題的一個(gè)權(quán)衡,所以簇頭節(jié)點(diǎn)的策略集為{轉(zhuǎn)發(fā)簇內(nèi)節(jié)點(diǎn)數(shù)據(jù)包,不轉(zhuǎn)發(fā)簇內(nèi)節(jié)點(diǎn)數(shù)據(jù)包}。
由于分簇路由協(xié)議一般是在多跳范圍內(nèi)實(shí)現(xiàn)數(shù)據(jù)的通信,所以收益考慮了多跳范圍內(nèi)的連通性,同時(shí)基于節(jié)點(diǎn)的自我理性偏好分析,節(jié)點(diǎn)的收益取決于是否成功將自身數(shù)據(jù)包發(fā)送到Sink節(jié)點(diǎn),因此,定義為
其中:為數(shù)據(jù)包成功發(fā)送至Sink節(jié)點(diǎn)所獲得的獎(jiǎng)勵(lì);為數(shù)據(jù)包一跳傳輸成功的概率;為通信跳數(shù)。
當(dāng)節(jié)點(diǎn)當(dāng)選為簇頭節(jié)點(diǎn)時(shí)其代價(jià)[17]為
當(dāng)節(jié)點(diǎn)為簇內(nèi)節(jié)點(diǎn)時(shí)其代價(jià)為
(4)
節(jié)點(diǎn)進(jìn)行數(shù)據(jù)的轉(zhuǎn)發(fā)是一個(gè)重復(fù)博弈的過程。假設(shè)節(jié)點(diǎn)重復(fù)博弈次,那么,節(jié)點(diǎn)的累積效用為
在實(shí)際情況下,由于每個(gè)節(jié)點(diǎn)死亡時(shí)間是不確定的,故網(wǎng)絡(luò)節(jié)點(diǎn)的整個(gè)博弈結(jié)束時(shí)間存在不確定性,這種博弈就成為可能隨機(jī)結(jié)束的重復(fù)博弈,在一般情況下,這種博弈可以按無限次重復(fù)博弈進(jìn)行分析,那么該博弈模型中節(jié)點(diǎn)的平均效用[6]為
式(1)的效用函數(shù)是節(jié)點(diǎn)在一次博弈中所獲得的收益,從效用函數(shù)中可以看出,在階段性博弈中對(duì)于簇頭節(jié)點(diǎn)而言,采取不轉(zhuǎn)發(fā)的策略所獲得的效用值更大,從自身利益出發(fā),會(huì)存在節(jié)點(diǎn)選擇自私行為以節(jié)省自身能量。因此,在階段博弈中博弈參與者采取不轉(zhuǎn)發(fā)的策略即為此次博弈的納什均衡,但博弈是一個(gè)重復(fù)過程,節(jié)點(diǎn)的自私行為會(huì)導(dǎo)致網(wǎng)絡(luò)的整體性能的下降,為了防止這種現(xiàn)象的產(chǎn)生,本文引入懲罰機(jī)制。
2.2 懲罰機(jī)制
由節(jié)點(diǎn)的理性偏好可知:節(jié)點(diǎn)選擇不合作的策略是由于其只考慮到當(dāng)前單次博弈的收益,沒有考慮到當(dāng)前不合作行為對(duì)未來收益的影響。若不對(duì)節(jié)點(diǎn)采取相應(yīng)的懲罰措施,則會(huì)導(dǎo)致某些節(jié)點(diǎn)不考慮長(zhǎng)久收益,從短期收益出發(fā)采取不轉(zhuǎn)發(fā)其他節(jié)點(diǎn)數(shù)據(jù)包的自私行為,導(dǎo)致網(wǎng)絡(luò)整體性能下降。
本文對(duì)自私節(jié)點(diǎn)采取如下懲罰措施,以保證節(jié)點(diǎn)采取合作的態(tài)度:當(dāng)節(jié)點(diǎn)在上一輪采取自私行為時(shí),整個(gè)網(wǎng)絡(luò)會(huì)立即標(biāo)記該節(jié)點(diǎn)的所屬ID,在其后輪的簇頭選擇過程中,會(huì)將這些自私節(jié)點(diǎn)選為簇頭節(jié)點(diǎn),強(qiáng)制其轉(zhuǎn)發(fā)簇內(nèi)節(jié)點(diǎn)的數(shù)據(jù)包,使其付出的代價(jià)超過當(dāng)前作弊所獲得的短期收益,從而對(duì)節(jié)點(diǎn)產(chǎn)生足夠的威懾,迫使節(jié)點(diǎn)在后面的數(shù)據(jù)轉(zhuǎn)發(fā)中采取合作的態(tài)度。節(jié)點(diǎn)接受完懲罰以后在下一輪的博弈中以新的狀態(tài)繼續(xù)參與數(shù)據(jù)的發(fā)送/轉(zhuǎn)發(fā)。
為了保證整個(gè)策略的合理性,本文重點(diǎn)在于研究對(duì)自私節(jié)點(diǎn)懲罰的最優(yōu)輪數(shù),即在保證對(duì)自私節(jié)點(diǎn)產(chǎn)生足夠震懾的同時(shí),防止節(jié)點(diǎn)因所受懲罰程度過大而造成節(jié)點(diǎn)過早死亡,影響網(wǎng)絡(luò)的整體性能,下面對(duì)懲罰的最優(yōu)輪數(shù)予以證明。
假設(shè)節(jié)點(diǎn)在第一輪當(dāng)選為簇頭節(jié)點(diǎn),一開始采取自私的行為,其獲得的效用值為,網(wǎng)絡(luò)會(huì)標(biāo)記節(jié)點(diǎn)的ID,懲罰節(jié)點(diǎn)在后面的輪中作為簇頭節(jié)點(diǎn),此時(shí)每輪所獲得的平均效用值為,在以后節(jié)點(diǎn)再次當(dāng)選為簇頭節(jié)點(diǎn)時(shí)將一直采取合作的策略,此時(shí)每輪的所獲得的平均效用值為。
(8)
其中:為簇頭節(jié)點(diǎn)所占比例。
由于無限重復(fù)博弈平均收益計(jì)算更加方便,所以給出此時(shí)節(jié)點(diǎn)的平均效用值為
(10)
若節(jié)點(diǎn)始終采取合作的策略,則它的平均效用為
為了促進(jìn)簇頭節(jié)點(diǎn)選擇合作策略進(jìn)行數(shù)據(jù)的轉(zhuǎn)發(fā),單階段博弈達(dá)成子博弈完美納什均衡,則有:
>
對(duì)式(12)兩邊取自然對(duì)數(shù),得
>(13)
式(13)給出了懲罰節(jié)點(diǎn)輪數(shù)的取值范圍,據(jù)此可以確定的最佳取值,以實(shí)現(xiàn)對(duì)節(jié)點(diǎn)產(chǎn)生足夠的震懾的同時(shí),又不會(huì)對(duì)懲罰節(jié)點(diǎn)造成過多的能量損耗。
整個(gè)博弈過程如圖2所示,假設(shè)無線傳感器網(wǎng)絡(luò)中所有節(jié)點(diǎn)的初始能量保持一致,首先要按照分簇路由協(xié)議進(jìn)行簇頭選擇,選完簇頭以后進(jìn)入到數(shù)據(jù)傳輸階段,簇內(nèi)節(jié)點(diǎn)將數(shù)據(jù)包發(fā)送給相應(yīng)的簇頭節(jié)點(diǎn),簇頭節(jié)點(diǎn)要對(duì)是否轉(zhuǎn)發(fā)簇內(nèi)節(jié)點(diǎn)數(shù)據(jù)包進(jìn)行策略博弈。若節(jié)點(diǎn)選擇數(shù)據(jù)轉(zhuǎn)發(fā),則簇頭節(jié)點(diǎn)會(huì)進(jìn)行數(shù)據(jù)融合并將數(shù)據(jù)包轉(zhuǎn)發(fā)給Sink節(jié)點(diǎn);若簇頭節(jié)點(diǎn)為惡意節(jié)點(diǎn),選擇自私行為,網(wǎng)絡(luò)將會(huì)立即標(biāo)記該簇頭節(jié)點(diǎn)ID,在后續(xù)的輪中對(duì)節(jié)點(diǎn)進(jìn)行處罰,將其作為簇頭節(jié)點(diǎn)消耗更多的能量,從而對(duì)節(jié)點(diǎn)產(chǎn)生足夠的震懾,保證節(jié)點(diǎn)在未來的策略選擇時(shí)選擇合作行為。因此,本文所提出的重復(fù)博弈轉(zhuǎn)發(fā)模型可以很好地應(yīng)用于一般的分簇路由協(xié)議。
圖2 博弈過程
仿真實(shí)驗(yàn)選取分簇路由協(xié)議中最經(jīng)典的LEACH協(xié)議進(jìn)行實(shí)驗(yàn)分析,檢驗(yàn)基于LEACH協(xié)議的重復(fù)博弈模型的性能,利用Matlab仿真工具進(jìn)行仿真實(shí)驗(yàn)。通過對(duì)分簇路由協(xié)議LEACH[18?20]加入懲罰機(jī)制前后性能的對(duì)比以及加入不同程度的懲罰機(jī)制后網(wǎng)絡(luò)性能的對(duì)比,證明了該模型的優(yōu)越性。設(shè)網(wǎng)絡(luò)的生命周期為出現(xiàn)首個(gè)死亡節(jié)點(diǎn)的時(shí)間。該模型參數(shù)設(shè)置如表1所示,基于文獻(xiàn)[17]可以得出在兩跳范圍內(nèi)節(jié)點(diǎn)的成功傳輸?shù)母怕蚀蠹s0.9,所以在本文將值設(shè)定為0.9。
表1 網(wǎng)絡(luò)參數(shù)設(shè)置
圖3所示為網(wǎng)絡(luò)模擬運(yùn)行10次的網(wǎng)絡(luò)壽命圖。從圖3可以看出:當(dāng)采取最嚴(yán)苛的懲罰策略(即一旦節(jié)點(diǎn)采取自私行為,其將在以后的數(shù)據(jù)傳輸中均被懲罰作為簇頭節(jié)點(diǎn)直至死亡)時(shí),網(wǎng)絡(luò)的平均壽命約為3 800輪,不采取懲罰措施網(wǎng)絡(luò)的平均壽命約為4 600輪,不采取懲罰措施網(wǎng)絡(luò)的壽命要高于采取懲罰措施的壽命約21.05%。
1—采取懲罰措施;2—不采取懲罰措施。
圖4所示為網(wǎng)絡(luò)模擬運(yùn)行10次時(shí)網(wǎng)絡(luò)整體效用圖,網(wǎng)絡(luò)整體效用即為網(wǎng)絡(luò)壽命結(jié)束之前所有節(jié)點(diǎn)所獲得效用值的總和。從圖4可以看出:由于懲罰機(jī)制的引入,迫使節(jié)點(diǎn)之間相互合作,使得網(wǎng)絡(luò)的整體收益有所提升。網(wǎng)絡(luò)采取懲罰措施(最嚴(yán)苛)模擬運(yùn)行10次所得的平均網(wǎng)絡(luò)整體效用為7.7×105,而不采取懲罰措施所獲得的平均效用為7.1×105。由此可知,即使在最嚴(yán)苛的懲罰措施下,網(wǎng)絡(luò)模擬運(yùn)行10次后所得的平均網(wǎng)絡(luò)整體效用都要高于不采取懲罰措施的網(wǎng)絡(luò)效用。
1—采取懲罰措施;2—不采取懲罰措施。
從圖3和圖4可以看出:當(dāng)采用最嚴(yán)苛的懲罰策略,即使不采取懲罰措施的網(wǎng)絡(luò)壽命要高于采取懲罰措施的網(wǎng)絡(luò)壽命約21.05%,但在網(wǎng)絡(luò)壽命終止時(shí)采取懲罰措施所獲得的整體效用仍會(huì)高于不采取懲罰策略的網(wǎng)絡(luò)效用,由此可以得出采取懲罰策略雖然會(huì)減少網(wǎng)絡(luò)壽命,但是對(duì)提升網(wǎng)絡(luò)的數(shù)據(jù)傳輸性能是有 效的。
圖5所示為不同懲罰輪數(shù)對(duì)網(wǎng)絡(luò)生命周期的影響,圖5中離散點(diǎn)為不同懲罰輪數(shù)下實(shí)驗(yàn)10次所獲得的平均數(shù)據(jù),曲線為數(shù)據(jù)擬合的結(jié)果,前8個(gè)數(shù)據(jù)采用線性擬合方式,其后實(shí)驗(yàn)數(shù)據(jù)采用三階非線性擬合。從圖5可以看出:網(wǎng)絡(luò)的生命周期在懲罰節(jié)點(diǎn)為250輪左右時(shí)出現(xiàn)跳變,生命周期明顯提升,在250輪以后隨著懲罰輪數(shù)的增加,網(wǎng)絡(luò)生命周期不斷下降。
圖5 不同懲罰輪數(shù)下的網(wǎng)絡(luò)生命周期
圖6所示為不同懲罰輪數(shù)對(duì)網(wǎng)絡(luò)整體效用值的影響,采用與圖5中相同的數(shù)據(jù)擬合方式。從圖6可以看出:在250輪以前網(wǎng)絡(luò)效用保持在一個(gè)較低的水平,而當(dāng)節(jié)點(diǎn)懲罰輪數(shù)增加到250輪以后,網(wǎng)絡(luò)效用跳變提升,懲罰輪數(shù)在250輪以后,隨著懲罰輪數(shù)的增加,網(wǎng)絡(luò)效用又會(huì)緩慢下降。
圖6 不同懲罰輪數(shù)下的網(wǎng)絡(luò)效用
從圖5和圖6可以看出:當(dāng)懲罰輪數(shù)到達(dá)250輪時(shí),網(wǎng)絡(luò)的效用值與生命周期均會(huì)出現(xiàn)明顯的變化。當(dāng)懲罰輪數(shù)小于250輪時(shí),由于懲罰程度不足以對(duì)自私節(jié)點(diǎn)產(chǎn)生足夠的震懾,造成網(wǎng)絡(luò)性能的下降;當(dāng)懲罰輪數(shù)達(dá)到250輪左右時(shí),網(wǎng)絡(luò)的效用值與生命周期迅速提升,證明250輪左右的懲罰機(jī)制對(duì)節(jié)點(diǎn)已經(jīng)產(chǎn)生了足夠的震懾,抑制了節(jié)點(diǎn)的自私行為;當(dāng)懲罰輪數(shù)超過250輪時(shí),網(wǎng)絡(luò)的生命周期與效用值均下降。這說明對(duì)節(jié)點(diǎn)的懲罰程度有1個(gè)最佳值,證明了最佳懲罰輪數(shù)存在的合理性。當(dāng)超過最佳值時(shí),網(wǎng)絡(luò)的生命周期與網(wǎng)絡(luò)效用不升反降。因此,對(duì)節(jié)點(diǎn)的懲罰必須在一定的范圍之內(nèi),這樣既可以達(dá)到既震懾節(jié)點(diǎn)的自私性,又提高網(wǎng)絡(luò)性能的目的。
圖7所示為采取最優(yōu)懲罰輪數(shù)的網(wǎng)絡(luò)壽命與不采取懲罰策略網(wǎng)絡(luò)壽命的對(duì)比,網(wǎng)絡(luò)模擬運(yùn)行10次。從圖7可以看出:不采取懲罰措施網(wǎng)絡(luò)壽命約為4 600輪,采取最優(yōu)懲罰輪數(shù)策略網(wǎng)絡(luò)壽命約為4350輪,不采取懲罰措施的網(wǎng)絡(luò)壽命要高于采取最優(yōu)懲罰輪數(shù)策略的網(wǎng)絡(luò)壽命約5.75%。
1—采取最優(yōu)輪數(shù)懲罰措施;2—不采取懲罰措施。
圖8所示為采取最優(yōu)懲罰輪數(shù)策略與不采取懲罰措施的網(wǎng)絡(luò)整體效用對(duì)比圖,網(wǎng)絡(luò)模擬運(yùn)行10次。從圖8可以看出:采取最優(yōu)懲罰輪數(shù)策略在網(wǎng)絡(luò)壽命終止時(shí)所獲得的收益明顯高于不采取懲罰策略的網(wǎng)絡(luò)整體效用,提升約22.83%。
無線傳感器網(wǎng)絡(luò)采取最優(yōu)懲罰輪數(shù)的懲罰策略,將會(huì)在保證最小的減少網(wǎng)絡(luò)壽命的同時(shí),最大提升網(wǎng)絡(luò)的整體收益,從圖7和圖8可以看出網(wǎng)絡(luò)的整體收益相對(duì)于不采取懲罰策略提升約22.83%。
1—采取最優(yōu)輪數(shù)懲罰措施;2—不采取懲罰措施。
1) 以無限次重復(fù)博弈理論規(guī)范網(wǎng)絡(luò)簇頭節(jié)點(diǎn)的行為,通過引入懲罰機(jī)制,迫使節(jié)點(diǎn)之間相互合作,以實(shí)現(xiàn)最佳網(wǎng)絡(luò)性能。
2) 建立了基于無限次重復(fù)博弈的網(wǎng)絡(luò)模型,針對(duì)節(jié)點(diǎn)的自私行為引入不同程度的懲罰機(jī)制,并發(fā)現(xiàn)對(duì)自私節(jié)點(diǎn)的懲罰程度(懲罰輪數(shù))會(huì)極大影響網(wǎng)絡(luò)的生命周期和網(wǎng)絡(luò)效用。
3) 在WSN中不僅要對(duì)自私節(jié)點(diǎn)采用懲罰措施,而且需要確定對(duì)自私節(jié)點(diǎn)的最優(yōu)懲罰程度,即在保證自私節(jié)點(diǎn)受到足夠震懾的同時(shí),又不會(huì)對(duì)自私節(jié)點(diǎn)產(chǎn)生過大的傷害,在盡量保證網(wǎng)絡(luò)生存時(shí)間的同時(shí),又可提升網(wǎng)絡(luò)的整體效用。
[1] AKYILDIZ I F, SU W, SANKARASUBRAMANIAM Y, et al. Wireless sensor networks: a survey[J]. Computer Networks, 2002, 38(4): 393?422.
[2] LIU Qiang, HUANG Xiaoming, LENG Supeng, et al. Deployment strategy of wireless sensor networks for Internet of Things[J]. China Communications, 2011, 8(8): 111?120.
[3] LIAO Peikai, CHANG Minkuan,JAY KUO C C. A statistical approach to contour line estimation in wireless sensor networks with practical considerations[J]. IEEE Transactions on Vehicular Technology, 2009, 58(7): 3579?3595.
[4] YONG Qidong, CHEN Yang, YE Xiwen. Lifetime of WSN research based on energy balance[J]. Applied Mechanics and Materials. 2013, 303/304/305/306: 231?235.
[5] CHEN Bo, MAO Jianlin, GUO Ning, et al. An incentive detection mechanism for cooperation of nodes selfish behavior in wireless sensor networks[C]// 25th Control and Decision Conference (CCDC). Guiyang, 2013: 4021?4024.
[6] 范如國(guó). 博弈論[M]. 武漢: 武漢大學(xué)出版社, 2011: 221?227. FAN Ruguo. Game theory[M]. Wuhan: Wuhan University Publishing Ceremony, 2011: 221?227.
[7] WANG Jiangtao, CHEN Zhigang, DENG Xiaoheng. A trustworthy energy-efficient routing algorithm based on game-theory for WSN[C]// IET International Communication Conference on Wireless Mobile and Computing (CCWMC 2009). Shanghai, 2009: 192?196.
[8] 王博, 黃傳河, 楊文忠, 等. Ad Hoc網(wǎng)絡(luò)中基于懲罰機(jī)制的激勵(lì)合作轉(zhuǎn)發(fā)模型[J]. 計(jì)算機(jī)研究與發(fā)展, 2011, 48(3): 398?406. WANG Bo, HUANG Chuanhe, YANG Wenzhong, et al. An incentive-cooperative forwarding model based on punishment mechanism in wireless Ad Hoc networks[J]. Journal of Computer Research and Development, 2011, 48(3): 398?406.
[9] JAMIN B S, CHATTERJEE M, SAMANTA T. A game theoretic routing framework based on energy-delay conservation in WSNs[C]// 2015 IEEE Tenth International Conference on Intelligent Sensors, Sensor Networks and Information Processing (ISSNIP). Singapore, 2015: 1?5.
[10] LI Yuanjie, XU Hongyun, CAO Qiying, et al. Evolutionary game-based trust strategy adjustment among nodes in wireless sensor networks[J]. International Journal of Distributed Sensor Networks, 2015, 11(2): 1?12.
[11] LIU Yan. The application of Nash equilibrium in trust model of deterministic wireless sensor network[C]// 2014 Enterprise Systems Conference (ES). Shanghai, 2014: 284?288.
[12] AKKAYA K, YOUNIS M. A survey on routing protocols for wireless sensor networks[J]. Ad Hoc Networks, 2005, 3(3): 325?349.
[13] SUNDARESWARAN P, VARDHARAJULU K N, RAJESH R S. DECH: equally distributed cluster heads technique for clustering protocols in WSNs[J]. Wireless Personal Communications, 2015, 84(1): 137?151.
[14] QIAN Kaiguo. A clustering routing algorithm for sensor network based on distance probability[C]// 10th International Computer Conference on Wavelet Active Media Technology and Information Processing (ICCWAMTIP). Chengdu, 2013: 113?116.
[15] SHI Haiyan, WANG Wanliang, CHEN Shengyong, et al. Game theory for wireless sensor networks: a survey[J]. Sensors, 2012, 12(7): 9055?9097.
[16] RAJA P, DANANJAYAN P. Game theory based cooperative MIMO routing scheme for lifetime enhancement of WSN[J]. International Journal of Wireless Information Networks, 2015, 22(2): 116?125.
[17] WEN Hao, LIN Chuang, REN Fengyuan, et al. Retransmission or redundancy: transmission reliability study in wireless sensor networks[J]. Science China Information Sciences, 2012, 55(4): 737?746.
[18] SINGH K. WSN LEACH based protocols: a structural analysis[C]// 2015 International Conference and Workshop on Computing and Communication (IEMCON). Vancouver, Canada: IEEE, 2015: 1?7.
[19] PASHA M A, KHAN J H, MASUD S. I-LEACH: energy- efficient routing protocol for monitoring of irrigation canals[J]. Simulation, 2015, 91(8): 750?764.
[20] TANG Gaoming, LI Layuan, GAO Jipeng. IR-LEACH: an improved LEACH protocol for WSN[J]. Applied Mechanics and Materials. 2013, 373/374/375: 388?392.
(編輯 楊幼平)
Cooperative research of WSN nodes based on repeated game theory
ZHANG Chao, DONG Ying, Lü Yang, SU Zhenzhen
(College of Communication Engineering, Jilin University, Changchun 130012, China)
A repeated game model of the reliability of data transmission was proposed based on the hierarchical routing protocol. A punishment mechanism model in the game was introduced and the degree of punishment mechanism was demonstrated, which not only ensured the selfish node cooperation but also avoided the premature death of selfish nodes subjected to excessive punishment. The results show that the penalty strategy with the optimal penalty round can guarantee the minimum reduction of the network life cycle. The efficiency of the network can be improved by the penalty strategy with the optimal penalty round about 22.83%.
wireless sensor network (WSN); energy balance; routing; repeated game; rational preferences
10.11817/j.issn.1672-7207.2017.07.011
TP393
A
1672?7207(2017)07?1762?07
2016?07?16;
2016?09?19
國(guó)家自然科學(xué)基金資助項(xiàng)目(61107040);吉林大學(xué)研究生創(chuàng)新研究計(jì)劃項(xiàng)目(2015111) (Project(61107040) supported by the National Natural Science Foundation of China; Project(2015111) supported by Graduate Innovation Research Program of Jilin University)
董穎,博士,副教授,從事無線網(wǎng)絡(luò)通信研究;E-mail: dongying@ jlu.edu.cn