徐 娟 張 茸 闞佳麗 張 妍
(同濟大學(xué)電子與信息工程學(xué)院 上海 201804)
納米技術(shù)的快速發(fā)展使得制造納米級的傳感器[1-2]變得實際可行,相比于傳統(tǒng)的無線傳感器網(wǎng)絡(luò)(wireless sensor networks, WSNs),納米傳感器節(jié)點不僅尺寸微小而且具有納米級的感知、存儲、計算和通信能力.無線納米傳感器網(wǎng)絡(luò)[3](wireless nano-sensor networks, WNSNs)正是一種將多個納米設(shè)備以無線通信方式連接起來的新型傳感器網(wǎng)絡(luò).網(wǎng)絡(luò)中的納米節(jié)點通過協(xié)作通信的方式執(zhí)行感知任務(wù),共享感知到的信息[4-5].目前無線納米傳感網(wǎng)在生物醫(yī)學(xué)、環(huán)境監(jiān)測以及軍事防御等領(lǐng)域都具有巨大的應(yīng)用前景,因此它成為了新的研究熱點.
隨著無線通信技術(shù)和信息化社會的快速發(fā)展,低頻段的頻譜資源已無法滿足人們對超高速數(shù)據(jù)傳輸速率的要求,在這一趨勢下太赫茲(THz)通信[6-10]的出現(xiàn)可以緩解頻譜稀缺和現(xiàn)代無線系統(tǒng)傳輸容量的局限性.太赫茲波是介于毫米波與遠(yuǎn)紅外光之間的電磁波,其頻率范圍是0.1~10THz.太赫茲帶具有很寬的可用帶寬,并且可以提供10 Gbps甚至更高的數(shù)據(jù)傳輸速率,但是太赫茲波在空氣中傳播時存在較嚴(yán)重的大氣衰減[6],因此太赫茲通信被視為可以滿足短距離超高速無線通信的關(guān)鍵技術(shù).太赫茲無線通信具有很多微波通信和光通信所沒有的獨特優(yōu)勢,比如波束窄、方向性極強,可用于目標(biāo)探測以及精確定位[7];極短的波長使其天線和收發(fā)系統(tǒng)的尺寸更小、更經(jīng)濟[8].使用新型納米材料——石墨烯[11-13]制造的納米天線和納米收發(fā)機可工作在太赫茲帶,因此太赫茲無線通信技術(shù)成為WNSNs物理層的理想選擇.
文獻[13]對基于時域擴展開關(guān)鍵控(time spread on-off keying, TS-OOK)的太赫茲納米網(wǎng)中存在的數(shù)據(jù)碰撞問題進行了研究,研究表明由于分子吸收噪聲和接收節(jié)點能量的波動,導(dǎo)致數(shù)據(jù)在傳輸過程中會發(fā)生連續(xù)性的碰撞,而且這種碰撞是不可避免的,從而大大降低了通信質(zhì)量.因此需要研究適用于基于TS-OOK的太赫茲納米傳感器網(wǎng)絡(luò)的媒質(zhì)接入控制(medium access control, MAC)協(xié)議,從而能盡量降低產(chǎn)生數(shù)據(jù)碰撞的概率.考慮太赫茲信道的特性,傳統(tǒng)的無線傳感器網(wǎng)的經(jīng)典MAC協(xié)議無法直接應(yīng)用于WNSNs,因此研究適用于太赫茲納米傳感網(wǎng)的MAC協(xié)議是非常有意義的.
目前國內(nèi)外已經(jīng)有學(xué)者研究出了一些適用于無線納米傳感器網(wǎng)絡(luò)的MAC協(xié)議.文獻[14]提出的物理層感知的MAC協(xié)議(a physical layer aware MAC protocol for electromagnetic nanonetworks in the terahertz band, PHLAME)通過納米收發(fā)機共同選擇物理層參數(shù)的最佳值、減少多用戶干擾和降低能耗來保證可靠通信.雖然PHLAME協(xié)議在減少能耗和幀延時以及增大吞吐量方面都取得一定成效,但節(jié)點間通信仍存在發(fā)生連續(xù)沖突的問題;Wang等人[15]提出一種基于能量和頻譜感知的MAC協(xié)議(energy and spectrum-aware MAC protocol for perpetual wireless nanosensor networks in the terahertz band),該協(xié)議讓納米節(jié)點搭載能量采集系統(tǒng)使網(wǎng)絡(luò)的生命周期趨于無窮大,同時考慮太赫茲信道擁有很大帶寬的特點,采用新的碼元壓縮調(diào)度算法使吞吐量最大化.但該協(xié)議只考慮了中心節(jié)點控制的集中式網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),尚未分析納米節(jié)點以自組織方式通信的分布式模型;Mohrehkesh等人[16]針對以上2種協(xié)議均不能應(yīng)用于分布式的自組織網(wǎng)絡(luò),提出由接收節(jié)點控制、基于能量采集的MAC協(xié)議(receiver-initiated harvesting-aware MAC for nanonetworks, RIH-MAC).RIH-MAC以節(jié)能為主要目標(biāo),引入納米能量采集模型,采用由接收節(jié)點控制的通信模型取代傳統(tǒng)的握手過程,然而該協(xié)議應(yīng)用于分布式的自組織網(wǎng)絡(luò)時仍存在隱藏終端問題,且納米節(jié)點采集能量的過程耗時較長,僅適用于延時可容忍的場景;文獻[17]提出了TCN-MAC協(xié)議(a timing channel-based MAC protocol for energy-efficient nanonetworks),該協(xié)議以定時信道為基礎(chǔ),并在定時信道的靜默期對信息進行編碼,接收機則根據(jù)靜默期共享的編碼映射表重新構(gòu)建來自發(fā)送端的數(shù)據(jù).最后通過對理論數(shù)值結(jié)果進行分析,驗證了利用定時信道延長網(wǎng)絡(luò)生命周期具有可行性,但并未在仿真平臺或?qū)嶋H的網(wǎng)絡(luò)環(huán)境中應(yīng)用并驗證該協(xié)議;Rikhtegar等人在文獻[18]中針對移動多跳的無線納米傳感器網(wǎng)絡(luò)提出了一種能量高效的MAC協(xié)議(energy efficient wireless nano sensor network, EEWNSN),該協(xié)議將納米傳感器節(jié)點進行分簇后利用時分多址(time division multiple access, TDMA)機制減小節(jié)點移動和傳輸碰撞帶來的影響;文獻[19]提出了一種負(fù)載感知的TDMA協(xié)議(load-aware TDMA, LA-TDMA),該協(xié)議根據(jù)當(dāng)前網(wǎng)絡(luò)中源節(jié)點的數(shù)目、業(yè)務(wù)量大小以及太赫茲信道的傳輸特性,在TDMA基礎(chǔ)上實現(xiàn)動態(tài)分配時隙算法,在平均端到端時延和平均吞吐量方面具有明顯的優(yōu)勢,可以應(yīng)用于時延要求較苛刻的網(wǎng)絡(luò)場景中,但是該協(xié)議并未考慮納米節(jié)點的能耗問題.由于無線納米傳感網(wǎng)中的納米設(shè)備資源受限,納米電池只能存儲有限的電量且多數(shù)應(yīng)用場景中納米電池難以更換,也無法充電,這是MAC協(xié)議設(shè)計所面臨的挑戰(zhàn)之一;能量采集技術(shù)作為一種可以為電池持續(xù)補充能量的技術(shù)手段,在滿足系統(tǒng)可持續(xù)工作方面具有很重要的意義.由于技術(shù)受限,傳統(tǒng)的能量采集機制如太陽能、風(fēng)能或水能無法應(yīng)用于納米傳感器節(jié)點,有學(xué)者提出了納米級的能量采集系統(tǒng)[20],該系統(tǒng)利用ZnO納米線的壓電效應(yīng)將采集到的振動能、聲能以及電磁能轉(zhuǎn)化為電能.
由于在納米傳感器中引入壓電式能量采集系統(tǒng)既可以解決節(jié)點能量有限的瓶頸問題,又可以延長網(wǎng)絡(luò)的生存期,因此本文考慮將壓電式能量采集系統(tǒng)應(yīng)用于無線納米傳感網(wǎng).由于傳統(tǒng)WSNs的MAC協(xié)議主要以降低節(jié)點能耗以及延長網(wǎng)絡(luò)生存期為目標(biāo),而基于能量采集的WNSNs具有能量補充的特性,設(shè)計MAC協(xié)議時應(yīng)該考慮在自供電節(jié)點永久工作的前提下最大化網(wǎng)絡(luò)的性能,因此傳統(tǒng)WSNs的MAC協(xié)議不再適用,需要重新研究基于能量采集的MAC協(xié)議.
為了保證網(wǎng)絡(luò)運行的可持續(xù)性并提高系統(tǒng)傳輸?shù)目煽啃?,本文提出一種基于能量采集的分布式TDMA協(xié)議(distributed energy harvesting-based TDMA, DEH-TDMA),該協(xié)議采用基于TDMA的時隙分配方式,并引入壓電式納米能量采集系統(tǒng)以突破節(jié)點能量有限的瓶頸.首先從納米節(jié)點的角度,將其緩存區(qū)的數(shù)據(jù)包數(shù)量和剩余能量作為狀態(tài)信息構(gòu)建Markov決策過程[21](Markov decision process, MDP)模型,其中設(shè)計收益函數(shù)時將節(jié)點的數(shù)據(jù)包傳輸量和能耗作為考慮因素,然后離線求解出使整個網(wǎng)絡(luò)數(shù)據(jù)包傳輸量最大化的最優(yōu)時隙分配策略,最終在WNSNs生命周期趨于無窮大的條件下,納米節(jié)點根據(jù)自身狀態(tài)通過查表的方式獲取最佳的信道接入方式.
常見的WNSNs是由一個處理能力較強的納米控制節(jié)點和多個普通傳感器節(jié)點組成的單跳星型網(wǎng)絡(luò)結(jié)構(gòu).網(wǎng)絡(luò)中普通的納米傳感器節(jié)點負(fù)責(zé)采集數(shù)據(jù),并直接與納米控制節(jié)點進行數(shù)據(jù)傳輸,最后控制節(jié)點將融合后的數(shù)據(jù)發(fā)送給納米接口設(shè)備.控制節(jié)點負(fù)責(zé)協(xié)調(diào)、管理普通的納米節(jié)點以及融合納米節(jié)點感知的數(shù)據(jù).將算法中的復(fù)雜計算交給控制節(jié)點處理可彌補普通納米節(jié)點計算能力有限的缺陷,因此本文采用集中式拓?fù)浣Y(jié)構(gòu),控制節(jié)點和普通納米節(jié)點之間的通信為單跳通信.
DEH-TDMA協(xié)議采用基于單跳通信的星型拓?fù)浣Y(jié)構(gòu).網(wǎng)絡(luò)由一個具有較強計算和處理能力的納米控制節(jié)點和若干個普通的納米節(jié)點組成,用圖G=(V,E)來表示W(wǎng)NSNs的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),其中V={v0,v1,…,vn}表示納米控制節(jié)點和所有納米節(jié)點的集合,v0表示納米控制節(jié)點,E表示節(jié)點之間單跳鏈路的集合.
網(wǎng)絡(luò)模型存在3種假設(shè):
1) 自供電的納米節(jié)點隨機分布于監(jiān)測區(qū)域,且納米節(jié)點和控制節(jié)點的位置均固定不變.
2) 納米節(jié)點可以感知到自身納米電池的剩余能量值,所有納米節(jié)點都能夠通過壓電式能量采集系統(tǒng)從環(huán)境中采集到能量,納米控制節(jié)點的能量則不受限;同時納米節(jié)點將感知到的數(shù)據(jù)放在緩存隊列中等待發(fā)送.
3) 納米節(jié)點在采集、計算和傳輸數(shù)據(jù)的過程中,數(shù)據(jù)傳輸是其主要的能耗組成部分,計算能耗時將忽略納米節(jié)點采集數(shù)據(jù)和計算處理所消耗的能量.
由于太赫茲信道存在分子吸收效應(yīng),不僅會引起較高的分子吸收損耗,而且數(shù)據(jù)在太赫茲信道中傳輸時會引入分子吸收噪聲.
分子吸收噪聲是太赫茲信道中的主要噪聲源,其功率譜密度Na(d,f)可表示為
Na(d,f)=KBT0(1-e-k(f)d),
(1)
其中,KB表示玻爾茲曼常數(shù),T0表示參考溫度,k(f)表示分子吸收因子,根據(jù)文獻[22]可得分子吸收因子為
(2)
其中,ki,g(f)表示在某一介質(zhì)g中氣體分子i的吸收因子.分子吸收因子的取值與介質(zhì)中分子的組成成分有關(guān),例如標(biāo)準(zhǔn)大氣中含有氮分子、氧分子和水分子,不同的分子成分在太赫茲帶內(nèi)具有不同的共振頻率,其中水分子對太赫茲波的吸收作用顯著.
總的路徑損耗Lp(d,f)由太赫茲波在介質(zhì)中傳播時所遭受的損耗和由分子吸收效應(yīng)引起的損耗這2部分組成,路徑損耗Lp(d,f)可以表示為
(3)
其中,fc表示中心頻率,c表示真空中的光速,k(f)是分子吸收因子.
在基于TS-OOK調(diào)制的太赫茲通信系統(tǒng)中,納米節(jié)點發(fā)送和接收單個數(shù)據(jù)包所消耗的能量可表示為
Etx(Nbit)=ωNbitEptx,
(4)
(5)
其中,Etx(Nbit),Erx(Nbit)分別表示納米節(jié)點發(fā)送、接收長度為Nbit(單位為b)的數(shù)據(jù)包的能耗;Eptx和Eprx分別表示發(fā)射和接收單個脈沖所消耗的能量;ω的取值與編碼權(quán)重值有關(guān),其表示Nbit數(shù)據(jù)中出現(xiàn)符號“1”的概率,通常為了使符號“1”和符號“0”等概率出現(xiàn),設(shè)ω=0.5.對于超低功耗的納米收發(fā)機而言,接收能耗Eprx通常被設(shè)為發(fā)射能耗Eptx值的110[23].本文用文獻[24]提供的基于TS-OOK調(diào)制的太赫茲信道參數(shù),即當(dāng)納米節(jié)點的通信范圍為0.01 m 時,發(fā)射和接收單個脈沖所消耗的能量Eptx和Eprx的取值分別為1 pJ和0.1 pJ.
壓電式納米發(fā)電機主要由ZnO納米線陣列、整流電路以及納米超級電容組成.其主要的能量采集原理是將一些外界能量源如周圍環(huán)境中的振動或人工產(chǎn)生的超聲波轉(zhuǎn)換為電能,具體來講,環(huán)境中的振動會使納米線周期性地收縮和伸展,每次伸縮過程中納米線2端將產(chǎn)生正向和反向的電流,經(jīng)適當(dāng)整流后給電容充電.若納米線經(jīng)過ncr次伸縮之后,此時電容2端的電壓值可以表示為關(guān)于周期數(shù)ncr的函數(shù)[22]:
(6)
其中,Ucap(ncr)為充電過程中電容2端的電壓值,它是一個關(guān)于周期數(shù)ncr的函數(shù).U表示理想電壓源的電壓,ncr表示當(dāng)前納米線伸縮的周期數(shù),ΔQ表示每個周期能夠采集到的電量,Ccap表示納米超級電容的總?cè)萘?通過計算可以得到電容中當(dāng)前所存儲的能量Ecap(ncr):
(7)
于是,根據(jù)式(7)可以得到納米電池存儲能量的最大值Emax為
(8)
其中,Ccap和U分別是式(6)中電容的總?cè)萘亢湍芰坎杉b置的電壓值.
最終,納米能量采集裝置的采集速率λe為
(9)
其中,λe是能量采集的速率,其含義是單位時間內(nèi)可以獲取的能量(Js);fv表示外界能量源的振動頻率,也是能量采集裝置中納米線的伸縮頻率,其取值與振動類型有關(guān),例如空調(diào)冷氣的振動頻率為50 Hz,心跳的振動頻率為1 Hz等.可見由于位置因素以及外界能量源的不同,各納米節(jié)點的能量采集速度將有所差異.對于常見的振動源,其能量采集過程服從泊松分布[23],具體來講,節(jié)點ni在持續(xù)時間為tf的1幀內(nèi)采集的能量數(shù)x可用概率分布來描述:
(10)
其中,λe表示式(9)中采集能量的平均到達速率.
本文采用泊松過程模型來描述WNSNs節(jié)點緩存中數(shù)據(jù)包的到達模型[25],且到達緩存區(qū)的數(shù)據(jù)包均遵循“先入先出”的排隊原則.假設(shè)節(jié)點ni的數(shù)據(jù)包平均到達速率為λp,則在持續(xù)時間為tf的1幀內(nèi)到達的數(shù)據(jù)包個數(shù)y服從概率分布:
(11)
控制系統(tǒng)的決策者在時刻t觀察到系統(tǒng)當(dāng)前所處的狀態(tài),并根據(jù)該狀態(tài)采取一個行動.此時,該行動會對系統(tǒng)運行產(chǎn)生2個影響:1)獲得一個即得的收益;2)系統(tǒng)的狀態(tài)會以與該行動有關(guān)的一個概率在時刻t+1轉(zhuǎn)移到一個新的狀態(tài),這時決策者需選取時刻t+1的決策.Markov決策過程便是如此一步一步循環(huán)下去,不同的只是當(dāng)前狀態(tài)可能是一個新狀態(tài),而且可采取的行為集合將隨著狀態(tài)變化而改變[21].因此MDP可表示為由狀態(tài)空間S、決策行為空間A、狀態(tài)轉(zhuǎn)移概率矩陣T和收益函數(shù)R組成的四元組[S,A,T,R],其中用T(sj|si,ak)表示在狀態(tài)si在時刻t執(zhí)行行動ak后在下一時刻t+1到達狀態(tài)sj的概率,用R(si,ak)表示決策者在狀態(tài)si執(zhí)行行動ak而獲得的收益.
狀態(tài)轉(zhuǎn)移概率可具體表示為
T(sj|si,ak)=Pr{st+1=sj|st=si,at=ak},
si,sj∈S,ak∈A,
(12)
且滿足:
(13)
由以上分析可知,MDP模型中的收益和狀態(tài)轉(zhuǎn)移概率并不依賴于過去的歷史,而僅僅依賴于當(dāng)前狀態(tài)和決策者選取的行動.同樣地,在基于能量采集的WNSNs中,納米節(jié)點當(dāng)前時刻的能量狀態(tài)以及緩存區(qū)的數(shù)據(jù)包狀態(tài)只與上一時刻的狀態(tài)有關(guān),因此符合Markov過程的屬性,從而可將Markov決策過程應(yīng)用于基于能量采集的MAC協(xié)議設(shè)計中,并且控制節(jié)點充當(dāng)了模型中決策者的角色.
本文提出的DEH-TDMA協(xié)議,其采用的幀結(jié)構(gòu)如圖1所示,其中網(wǎng)絡(luò)初始化階段主要用于控制節(jié)點與普通節(jié)點間的時鐘同步和鏈路建立.每一幀由N個時隙塊組成,而每個時隙塊則包括T個時隙.其中1幀的長度以及每幀包含的時隙數(shù)N×T可由控制節(jié)點在時隙調(diào)度階段廣播,納米節(jié)點在數(shù)據(jù)傳輸階段根據(jù)自身緩存區(qū)數(shù)據(jù)包數(shù)量和剩余能量決策對應(yīng)的信道接入方式.基于該幀的結(jié)構(gòu),數(shù)據(jù)傳輸量較大的源節(jié)點可使用各自時隙塊的多個時隙發(fā)送有效數(shù)據(jù)給控制節(jié)點.具體的過程為:1)為納米節(jié)點接入信道的決策行為構(gòu)建具體的MDP模型,并采用離線的方式求解出局部最優(yōu)的策略;2)納米節(jié)點可根據(jù)自身實時的狀態(tài)信息通過查表的方式獲取對應(yīng)的決策結(jié)果,進而選擇睡眠或占用相應(yīng)的時隙傳輸數(shù)據(jù).我們將針對DEH-TDMA協(xié)議分別在3.3,3.4,3.5,3.6中建立MDP模型的系統(tǒng)狀態(tài)、決策行為、狀態(tài)轉(zhuǎn)移概率和收益函數(shù),最終以最大化整個網(wǎng)絡(luò)的數(shù)據(jù)傳輸量為目標(biāo),對所建MDP模型求解出與節(jié)點狀態(tài)相對應(yīng)的決策行為集合.值得一提的是,DEH-TDMA協(xié)議只從納米節(jié)點的角度考慮接入信道的行為而不對節(jié)點加以區(qū)分,因此分析均省略了下標(biāo)ni.由于一幀持續(xù)時間較短,本文對數(shù)據(jù)傳輸量和能耗的分析均以幀長為單位,且假設(shè)納米節(jié)點只能使用當(dāng)前緩存的數(shù)據(jù)包以及剩余的能量,其在本幀期間到達的數(shù)據(jù)和能量均用于下一幀的傳輸.
Fig. 1 Frame structure of DEH-TDMA圖1 DEH-TDMA幀結(jié)構(gòu)
單個數(shù)據(jù)傳輸時隙的長度tslot可表示為
(14)
其中,i∈{1,2,…,N},di和Li分別表示源節(jié)點vi的傳輸距離和所發(fā)送數(shù)據(jù)包的長度,且本文設(shè)置所有源節(jié)點的數(shù)據(jù)包長度相同;v為信號的傳播速度且本文設(shè)置v=3×108ms;max()是求最大值函數(shù);C(di)表示節(jié)點vi傳輸鏈路的信道容量,表達式為
C(d)=
(15)
其中,C(d)表示傳輸距離為d時的太赫茲信道容量;M表示所有子帶的數(shù)量;Δfw(d)表示傳輸距離為d時不同的傳輸窗口,即每個子帶的可用帶寬;S(f)是傳輸信號的功率譜密度;Na(d,f)是信道中噪聲的功率譜密度;LP(d,f)表示路徑損耗.
在第f幀中,納米節(jié)點ni的狀態(tài)Sf是由節(jié)點緩存區(qū)數(shù)據(jù)包數(shù)量Df和剩余能量Ef組成的聯(lián)合狀態(tài):
(16)
其中,Dmax表示節(jié)點緩存區(qū)數(shù)據(jù)包數(shù)量的最大值,Emin表示納米節(jié)點正常工作所需的最小能量,本文將其值設(shè)置為收發(fā)單個數(shù)據(jù)包所消耗的能量,Emax表示式(8)中納米電池儲能的最大值.
為了計算方便,本文采用歸一化的能量,即將納米節(jié)點的剩余能量映射為當(dāng)前能量約束下可供發(fā)送的數(shù)據(jù)包數(shù)量:
(17)
(18)
對于自供電的納米節(jié)點ni,其緩存區(qū)的數(shù)據(jù)包數(shù)量和剩余能量可以表示為
Df+1=min(max(Df+S(Δt)-
αfPf,0),Dmax),
(19)
Ef+1=min(max(Ef+H(Δt)-
βfPfEtx,Emin),Emax),
(20)
其中,Df+1和Df分別表示在幀f+1和幀f的開始時刻納米節(jié)點緩存區(qū)的數(shù)據(jù)包數(shù)量;Ef+1和Ef分別表示在幀f+1和幀f的開始時刻納米節(jié)點的剩余能量值;Δt是上一幀f的長度,S(Δt)和H(Δt)分別表示在Δt時間內(nèi)納米節(jié)點從外界環(huán)境中感知的數(shù)據(jù)包數(shù)量以及通過能量采集系統(tǒng)獲取的能量值;αf和βf均為二值參數(shù),若αf=βf=1,表示節(jié)點ni在上一幀f中處于活躍狀態(tài)并參與了數(shù)據(jù)傳輸,否則αf=βf=0;Pf表示節(jié)點在幀f中的數(shù)據(jù)包傳輸量,Pf×Etx表示上一幀f中節(jié)點ni發(fā)送Pf個數(shù)據(jù)包的能耗,Etx由式(4)計算得到.
在Δt時間內(nèi)感知的數(shù)據(jù)包數(shù)量S(Δt)和獲取的能量值H(Δt)可以計算得到:
(21)
(22)
其中,λp是數(shù)據(jù)包的到達速率,λe是納米節(jié)點的能量采集速率,可由式(9)求得.
由式(16)(18)可以看出,納米節(jié)點的狀態(tài)空間大小為(Dmax+1)×(NT+1).
DEH-TDMA協(xié)議用Af表示納米節(jié)點ni的信道接入方式.納米節(jié)點在數(shù)據(jù)傳輸階段存在2種可操作行為(a0,a1),a0=0表示節(jié)點在當(dāng)前幀因缺乏可用能量或緩存區(qū)無數(shù)據(jù)到達而進入休眠態(tài),a1=1表示納米電池中儲備有充足的能量從而發(fā)送數(shù)據(jù),因此Af∈{a0,a1}.
一般情況下,基于能量采集的WNSNs中納米節(jié)點的數(shù)據(jù)到達和能量采集過程是相互獨立的,因此可假設(shè)節(jié)點的數(shù)據(jù)包狀態(tài)轉(zhuǎn)移概率和能量狀態(tài)轉(zhuǎn)移概率也是相互獨立的,從而節(jié)點的系統(tǒng)狀態(tài)轉(zhuǎn)移概率可通過分別求解能量狀態(tài)轉(zhuǎn)移概率和數(shù)據(jù)包狀態(tài)轉(zhuǎn)移概率而得到.
首先,需量化節(jié)點在當(dāng)前狀態(tài)下執(zhí)行相應(yīng)行為時的數(shù)據(jù)傳輸量和能耗.納米節(jié)點ni在狀態(tài)Sf=(Df,Ef)下采取行為Af獲得的數(shù)據(jù)包傳輸量和消耗的能量可表示為
P(Sf,Af)=min(T,min(Df,NEf)),
(23)
E(Sf,Af)=P(Sf,Af)×Etx,
(24)
T=min(Dmax,NT),
(25)
其中,P(Sf,Af)和E(Sf,Af)分別表示節(jié)點ni在幀f中傳輸?shù)臄?shù)據(jù)包個數(shù)和能耗;Df和NEf分別表示本幀節(jié)點緩存的數(shù)據(jù)包數(shù)量和剩余能量為Ef時可發(fā)送的數(shù)據(jù)包數(shù)量;T表示圖1所示的幀結(jié)構(gòu)中一個時隙塊包含的數(shù)據(jù)包傳輸量,為方便起見,本文假設(shè)節(jié)點在一個時隙內(nèi)只能傳輸一個數(shù)據(jù)包,因此T在數(shù)值上等于一個時隙塊包含的時隙數(shù).為了使納米節(jié)點盡可能多地將緩存數(shù)據(jù)包發(fā)送給控制節(jié)點,本文設(shè)置T的取值為節(jié)點在本幀內(nèi)數(shù)據(jù)傳輸量的最大值,而該值則由節(jié)點緩存區(qū)數(shù)據(jù)包數(shù)量的最大值Dmax和剩余能量達到最大值時所能發(fā)送的數(shù)據(jù)包數(shù)量NT聯(lián)合確定.
然后,根據(jù)以上對納米節(jié)點數(shù)據(jù)傳輸量和能耗的定量分析,并結(jié)合系統(tǒng)狀態(tài)轉(zhuǎn)移前后的能量和數(shù)據(jù)狀態(tài),如式(19)(20)所示,我們可進一步計算節(jié)點的數(shù)據(jù)包狀態(tài)轉(zhuǎn)移概率和能量狀態(tài)轉(zhuǎn)移概率.狀態(tài)轉(zhuǎn)移期間節(jié)點緩存區(qū)到達的數(shù)據(jù)包數(shù)量以及納米電池中到達的能量數(shù)可分別表示為
(26)
(27)
將式(26)代入式(11)所描述的數(shù)據(jù)包到達過程模型中,則可得到節(jié)點的數(shù)據(jù)包狀態(tài)轉(zhuǎn)移概率[26]:
(28)
其中,d是式(26)中狀態(tài)轉(zhuǎn)移期間到達的數(shù)據(jù)包數(shù)量,PD(d)表示式(11)中數(shù)據(jù)包到達服從的泊松分布.
當(dāng)Df+1=Dmax時,節(jié)點的數(shù)據(jù)包狀態(tài)轉(zhuǎn)移概率為
(29)
同理,將式(27)代入式(10)所描述的能量采集過程模型中,則可得到節(jié)點的能量狀態(tài)轉(zhuǎn)移概率[23]:
(30)
其中,e是式(27)中狀態(tài)轉(zhuǎn)移期間到達的能量數(shù),PE(e)表示式(10)中能量采集過程服從的泊松分布.
當(dāng)Ef+1=Emax時,節(jié)點的能量狀態(tài)轉(zhuǎn)移概率為
(31)
綜合數(shù)據(jù)包狀態(tài)轉(zhuǎn)移概率和能量狀態(tài)轉(zhuǎn)移概率,納米節(jié)點的狀態(tài)轉(zhuǎn)移概率為
P(Sf+1|Sf,Af)=
Pd(Df+1|Df,Af)Pe(Ef+1|Ef,Af),
(32)
其中,P(Sf+1|Sf,Af)表示納米節(jié)點在狀態(tài)Sf下采取行動Af后轉(zhuǎn)移到Sf+1的概率.
DEH-TDMA協(xié)議旨于綜合考慮納米節(jié)點緩存區(qū)的數(shù)據(jù)包數(shù)量和當(dāng)前的剩余能量,使用MDP模型求解出最優(yōu)策略來最大化整個網(wǎng)絡(luò)的吞吐量,同時降低網(wǎng)絡(luò)能耗,因此將數(shù)據(jù)傳輸量和能耗作為影響因子融入納米節(jié)點收益函數(shù)的設(shè)計中.
(33)
其中,R(Sf,Af)表示節(jié)點ni在狀態(tài)Sf下采取行為Af獲得的收益函數(shù),λp是數(shù)據(jù)包到達的平均速率,tf是1幀的長度,λp×tf則表示1幀內(nèi)平均到達的數(shù)據(jù)包個數(shù),P(Sf,Af)和E(Sf,Af)分別表示節(jié)點在本幀內(nèi)的數(shù)據(jù)傳輸量和能耗,且分別由式(23)和式(24)計算得到,Ec,max表示節(jié)點收發(fā)能耗的最大值.式(33)采用相對的數(shù)據(jù)傳輸量和能耗來分析節(jié)點的收益.
求解MDP模型的“有模型”方法有值函數(shù)迭代法(value function iteration)和策略迭代法(policy iteration)[27],兩者均需要進行增強學(xué)習(xí)的兩大步驟,即策略評估與策略改進,其中策略迭代的收斂速度更快一些,在狀態(tài)空間較小時,選用策略迭代方法效率更高,當(dāng)狀態(tài)空間較大時,值函數(shù)迭代法的計算量更小一些,本文中納米節(jié)點的狀態(tài)空間大小為(Dmax+1)(NT+1),所以選用值函數(shù)迭代算法求解上述建立的MDP模型,最終得到一個狀態(tài)空間Sf映射到?jīng)Q策行為空間Af的最優(yōu)策略.在MDP模型中,值函數(shù)被用來度量執(zhí)行給定策略的回報.對于給定的策略π(s),狀態(tài)值函數(shù)V(s)和行為值函數(shù)Q(s,a)可用貝爾曼公式表示:
(34)
(35)
其中,Vπ(s)和Vπ(s′)分別表示當(dāng)前狀態(tài)s和下一個狀態(tài)s′的狀態(tài)值函數(shù),Qπ(s,a)表示當(dāng)前狀態(tài)s下的行為值函數(shù),R(s,π(s))和P(s′|s,π(s))分別表示納米節(jié)點在狀態(tài)s執(zhí)行策略π(s)獲得的收益以及轉(zhuǎn)移到狀態(tài)s′的概率,且分別由式(33)和式(32)計算得到,γ是折扣因子,它用以保證值函數(shù)的收斂性且滿足γ∈[0,1).
最優(yōu)策略π*(s)是指狀態(tài)空間映射到?jīng)Q策行為,并且使值函數(shù)Vπ(s)或Qπ(s,a)最大的策略,值迭代算法的思想正是先根據(jù)式(34)或式(35)求出最大的值函數(shù),然后反解得到最優(yōu)策略.具體實現(xiàn)步驟如算法1所示,求解為
(36)
(37)
算法1.值函數(shù)迭代算法.
輸入:狀態(tài)空間Sf、行為空間Af、狀態(tài)轉(zhuǎn)移概率矩陣T、收益函數(shù)R、折扣因子γ;
輸出:最優(yōu)策略π*.
初始條件:f=0,V(s)=0,π*(s)=0,?s∈Sf;
f=f+1;
for alls∈Sfdo
計算式(35)中的Q函數(shù);
用最大的Q函數(shù)更新值函數(shù):
end for
end while
獲得值函數(shù)最大值Vπ*(s);
returnπ*.
DEH-TDMA協(xié)議的建立過程包括離線計算和網(wǎng)絡(luò)運行2個階段,其中離線計算包括建立并求解MDP模型,網(wǎng)絡(luò)運行包括網(wǎng)絡(luò)初始化和數(shù)據(jù)傳輸.
1) 離線計算.基于TDMA協(xié)議設(shè)計幀結(jié)構(gòu),然后綜合考慮節(jié)點緩存區(qū)的數(shù)據(jù)包數(shù)量和剩余能量,從納米節(jié)點的角度構(gòu)建MDP模型.通過量化節(jié)點在一幀內(nèi)獲得的數(shù)據(jù)包傳輸量以及消耗的能量,同時結(jié)合狀態(tài)轉(zhuǎn)移前后的數(shù)據(jù)和能量狀態(tài)來計算狀態(tài)轉(zhuǎn)移概率,并將數(shù)據(jù)傳輸量和能耗作為影響因子設(shè)計收益函數(shù).接著使用值迭代算法離線求解出節(jié)點狀態(tài)空間映射為具體決策行為的最優(yōu)策略,納米節(jié)點將策略數(shù)據(jù)保存在本地內(nèi)存中.
2) 網(wǎng)絡(luò)運行.網(wǎng)絡(luò)初始化階段主要用于控制節(jié)點與納米節(jié)點間的時鐘同步和鏈路建立;控制節(jié)點在時隙調(diào)度階段廣播一幀的長度tf以及每幀包含的時隙數(shù)N×T.納米節(jié)點通過查表的方式獲取與自身實時狀態(tài)Sf=(Df,Ef)相對應(yīng)的決策行為,若在本幀內(nèi)無數(shù)據(jù)傳輸或因能量不足而無法發(fā)送數(shù)據(jù),則可進入持續(xù)時間為tf的睡眠期;若有數(shù)據(jù)要發(fā)送且具備充足的能量,則在數(shù)據(jù)傳輸階段使用相應(yīng)的時隙資源.
由于DEH-TDMA協(xié)議采用離線的方式求解最優(yōu)策略,待網(wǎng)絡(luò)運行后,納米節(jié)點只需通過查表就可獲取決策結(jié)果,且每個節(jié)點的狀態(tài)空間和行為空間都較小,決策所需的計算量、時間以及內(nèi)存容量都很少,因此該協(xié)議能應(yīng)用于計算和存儲能力非常有限的納米節(jié)點.
本節(jié)對DEH-TDMA協(xié)議進行仿真分析,選擇經(jīng)典的TDMA協(xié)議以及文獻[19]中的LA-TDMA協(xié)議作為比較對象.
仿真分析將分別從節(jié)點的平均剩余能量、平均端到端時延和數(shù)據(jù)包傳輸成功率3個方面衡量DEH-TDMA協(xié)議、TDMA協(xié)議和LA-TDMA協(xié)議的性能.
1) 平均剩余能量
節(jié)點的平均剩余能量反映了網(wǎng)絡(luò)中能量的使用情況.
剩余能量的平均值:
(38)
其中,Eavg表示剩余能量的均值,Ei(t)表示第i個節(jié)點當(dāng)前的剩余能量值,K表示網(wǎng)絡(luò)中納米節(jié)點的總數(shù).
2) 平均端到端時延
平均端到端時延定義為數(shù)據(jù)包從源節(jié)點產(chǎn)生到控制節(jié)點成功接收所消耗的平均時間,包括處理時延、隊列時延、傳播時延和傳輸時延,它可表示為
(39)
值得一提的是,當(dāng)包到達間隔較小時,單位時間內(nèi)節(jié)點產(chǎn)生的數(shù)據(jù)包較多而可能導(dǎo)致某些數(shù)據(jù)包在當(dāng)前幀內(nèi)無法被傳輸,對應(yīng)地,式(39)中的隊列等待時延Tq,i增大,從而增加端到端的平均時延;當(dāng)網(wǎng)絡(luò)中的節(jié)點數(shù)增加時,幀長變長也會使Tq,i變大而導(dǎo)致數(shù)據(jù)包的平均端到端時延增大.
3) 數(shù)據(jù)包傳輸成功率
數(shù)據(jù)包傳輸成功率定義為控制節(jié)點成功接收的數(shù)據(jù)包數(shù)量與源節(jié)點發(fā)送的數(shù)據(jù)包總數(shù)之比.
仿真假設(shè)網(wǎng)絡(luò)中有1個控制節(jié)點和100個納米節(jié)點,仿真場景是面積為1 cm2的二維平面,控制節(jié)點位于平面中心,納米節(jié)點則隨機分布在該區(qū)域內(nèi).在仿真中,為了簡化計算,考慮介質(zhì)中水分子含量為10%的信道環(huán)境,此時式(2)中吸收因子k(f)取值為0.25[22].假設(shè)每個納米節(jié)點的數(shù)據(jù)傳輸速率為1 Mbps,通信范圍設(shè)為0.01 m,物理層仍采用基于100 fs長脈沖的TS-OOK調(diào)制技術(shù),單個數(shù)據(jù)包長度設(shè)為128 b,納米節(jié)點緩存的數(shù)據(jù)包上限D(zhuǎn)max設(shè)為5.
所有納米節(jié)點采用壓電式能量采集系統(tǒng),采集裝置的電壓U=0.42 V,單位周期采集到的電量ΔQ=6 pC,納米超級電容的總?cè)萘緾cap=9 nF,此時根據(jù)式(8)計算得到納米電池的最大儲能Emax=800 pJ,式(18)中儲能最大時可發(fā)送的數(shù)據(jù)包數(shù)量NT=11.每個納米節(jié)點的最小能量Emin和初始能量分別設(shè)為80 pJ和800 pJ.當(dāng)外界能量源的振動頻率fv=50 Hz時,式(9)中的能量采集速率λe≈17 pJs.
圖1所示的幀結(jié)構(gòu)總共有100個時隙塊,根據(jù)式(25)得到每個時隙塊包含5個時隙,其中單個時隙的長度設(shè)為200 μs.式(33)中節(jié)點能耗的最大值Ec,max=320 pJ,該值是納米節(jié)點完全占用5個時隙即發(fā)送5個數(shù)據(jù)包所消耗的能量.MDP模型中,折扣因子γ和值迭代算法的終止門限ε分別設(shè)為0.9和0.01.
仿真系統(tǒng)的運行時間設(shè)置為3 000個幀長,即300 s.固定節(jié)點的能量采集速率為20 pJs,研究數(shù)據(jù)包產(chǎn)生間隔的變化對WNSNs的性能影響.
1) 節(jié)點的平均剩余能量
圖2是對3種MAC協(xié)議的節(jié)點平均剩余能量比較.由圖2可見,隨著數(shù)據(jù)包產(chǎn)生間隔逐漸增大,節(jié)點的平均剩余能量均逐漸增大.這是因為當(dāng)數(shù)據(jù)包產(chǎn)生間隔很小,也就是節(jié)點緩存區(qū)到達的數(shù)據(jù)包較多時,較大的網(wǎng)絡(luò)負(fù)載造成了能耗的增加.
Fig. 2 Comparison of mean residual energy of nodes圖2 節(jié)點平均剩余能量比較
圖2表明DEH-TDMA的節(jié)點平均剩余能量大于TDMA和LA-TDMA,這是因為經(jīng)典的TDMA協(xié)議和LA-TDMA協(xié)議均未考慮能量補充的特性,納米節(jié)點在傳輸一定量的數(shù)據(jù)后就會能量耗盡,而DEH-TDMA協(xié)議中,納米節(jié)點可通過查表的方式獲取與實時狀態(tài)相對應(yīng)的信道接入方式,即使數(shù)據(jù)包產(chǎn)生間隔很小時,節(jié)點的能耗速率遠(yuǎn)遠(yuǎn)大于能量采集速率,節(jié)點則選擇不占用時隙而轉(zhuǎn)入能量采集狀態(tài),待采集有足夠的能量再進行數(shù)據(jù)傳輸.因此DEH-TDMA協(xié)議可通過納米節(jié)點能量補充的特性延長網(wǎng)絡(luò)生命周期,甚至使WNSNs的生命期趨于無窮大.
2) 平均端到端時延
Fig. 3 Average end-to-end delay comparison圖3 平均端到端時延比較
圖3是對3種MAC協(xié)議的平均端到端時延比較.從圖3中可以看出平均端到端時延隨著包產(chǎn)生間隔的增大而減小,這是因為包產(chǎn)生間隔變大時,單位時間內(nèi)到達節(jié)點緩存區(qū)的數(shù)據(jù)包變少,此時數(shù)據(jù)包在緩存區(qū)等待被傳輸?shù)臅r間就縮短,從而降低了端到端時延.由于LA-TDMA協(xié)議可以根據(jù)納米節(jié)點業(yè)務(wù)量的優(yōu)先級順序動態(tài)分配時隙,無數(shù)據(jù)發(fā)送的節(jié)點不分配時隙,為業(yè)務(wù)突發(fā)節(jié)點提供更多時隙,因此在減小端到端時延上較另外2種協(xié)議表現(xiàn)出明顯的優(yōu)勢.在DEH-TDMA協(xié)議中,納米節(jié)點需要花費較短的時間讀取存放在本地內(nèi)存中的決策結(jié)果,因此與傳統(tǒng)的TDMA協(xié)議相比,它在平均端到端時延上性能稍差,但是與LA-TDMA的差距也僅在0.1~0.3 ms.
3) 數(shù)據(jù)包傳輸成功率
圖4是對3種MAC協(xié)議的數(shù)據(jù)包傳輸成功率比較,這里是假設(shè)物理層是透明傳輸?shù)?,即假設(shè)信道是理想的,仿真實驗未考慮信道衰落引起的丟包現(xiàn)象.由圖4可見,數(shù)據(jù)包傳輸成功率不隨數(shù)據(jù)包產(chǎn)生間隔變化,且傳輸成功率基本都達到了100%,因此納米節(jié)點間不存在因沖突導(dǎo)致數(shù)據(jù)傳輸失敗,說明本文設(shè)計的時隙長度是合理的,因為時隙長度中考慮了數(shù)據(jù)包傳輸距離引入的時延,從而可以避免不同位置節(jié)點發(fā)送的數(shù)據(jù)包在控制節(jié)點處可能帶來的相鄰時隙部分重疊所造成的碼元碰撞.
Fig. 4 Comparison of packet transmission success rate圖4 數(shù)據(jù)包傳輸成功率比較
Fig. 5 Comparison of packet transmission success rate圖5 數(shù)據(jù)包傳輸成功率比較
圖5則是考慮了太赫茲信道之后的數(shù)據(jù)包傳輸成功率比較,由圖5可見,數(shù)據(jù)包傳輸成功率不隨數(shù)據(jù)包產(chǎn)生間隔變化,這是因為3種MAC協(xié)議均實現(xiàn)了無碰撞傳輸,納米節(jié)點間不存在因沖突導(dǎo)致數(shù)據(jù)傳輸失??;但由于太赫茲信道存在的分子吸收噪聲以及信道衰落會引起丟包現(xiàn)象.
針對納米節(jié)點能量非常有限無法保證WNSNs持續(xù)性運行的不足,本文引入壓電式納米能量采集系統(tǒng),提出一種基于能量采集的分布式TDMA協(xié)議.該協(xié)議基于納米節(jié)點緩存區(qū)數(shù)據(jù)包狀態(tài)和剩余能量狀態(tài)組成的聯(lián)合狀態(tài)構(gòu)建Markov決策過程模型,并通過值迭代算法離線求解出最優(yōu)策略.納米節(jié)點根據(jù)自身狀態(tài)通過查表的方式獲取信道接入方式,從而大大減輕了節(jié)點的計算壓力.最后仿真結(jié)果表明該協(xié)議在延長網(wǎng)絡(luò)生命周期上存在相當(dāng)明顯的優(yōu)勢,非常適合將該協(xié)議應(yīng)用于不易更換電池的場合,如體內(nèi),可以在體內(nèi)搭建人體健康監(jiān)測系統(tǒng),但是該系統(tǒng)需要根據(jù)臨床中人體健康數(shù)據(jù)的采集對網(wǎng)絡(luò)拓?fù)溥M行適當(dāng)?shù)恼{(diào)整同時還需要考慮人體健康數(shù)據(jù)的優(yōu)先級,這也將是本文未來的研究方向.