張富春,朱孔林,2
(1.北京郵電大學(xué) 人工智能學(xué)院,北京 100876;2.紫金山實(shí)驗(yàn)室,江蘇 南京 211111)
群體智能(Swarm Intelligence,SI)起源于對(duì)社會(huì)性昆蟲,如螞蟻、蜜蜂等的群體行為的研究,具有分布式和自組織性等特征[1]。群體中的個(gè)體基于環(huán)境狀態(tài)而動(dòng),通過(guò)與環(huán)境的智能交互形成整個(gè)群體的智能。在機(jī)器學(xué)習(xí)領(lǐng)域,人們通過(guò)相關(guān)的機(jī)器學(xué)習(xí)算法讓群體中的個(gè)體采取不同的行為,并根據(jù)從環(huán)境中獲得的反饋來(lái)優(yōu)化其個(gè)體行為,使得個(gè)體獲得智能進(jìn)而實(shí)現(xiàn)群體智能。未來(lái)的各種智能節(jié)點(diǎn)可能廣泛分布于端邊云各處,通過(guò)無(wú)線網(wǎng)絡(luò)連接在一起,并通過(guò)一定的群體智能算法來(lái)實(shí)現(xiàn)群體智能。
集群學(xué)習(xí)[2](Swarm Learning,SL)作為一種分布式的機(jī)器學(xué)習(xí)具有群體智能的部分特征,它通過(guò)無(wú)線網(wǎng)絡(luò)連接若干智能節(jié)點(diǎn),以去中心化的方式來(lái)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)。典型的SL系統(tǒng)由各種智能節(jié)點(diǎn)以及連接各節(jié)點(diǎn)的無(wú)線網(wǎng)絡(luò)組成。在實(shí)際的系統(tǒng)中,各個(gè)智能節(jié)點(diǎn)自主完成模型訓(xùn)練,并通過(guò)無(wú)線網(wǎng)絡(luò)來(lái)共享模型參數(shù)。
本文主要關(guān)注這種分布式機(jī)器學(xué)習(xí)系統(tǒng)中的節(jié)點(diǎn)選擇問(wèn)題,即如何決定每一輪由哪些節(jié)點(diǎn)參與模型的訓(xùn)練才能使整體訓(xùn)練效率最高,同時(shí)還要保證每個(gè)節(jié)點(diǎn)的能量消耗不超過(guò)對(duì)應(yīng)上限。之所以每一輪要選擇部分節(jié)點(diǎn)參與訓(xùn)練,是因?yàn)檫@種分布式的機(jī)器學(xué)習(xí)系統(tǒng)中參與訓(xùn)練的節(jié)點(diǎn)數(shù)量達(dá)到一定規(guī)模后,再增加節(jié)點(diǎn)數(shù)量帶來(lái)的整體收益增幅越來(lái)越小[3]。
SL系統(tǒng)的節(jié)點(diǎn)選擇并非一個(gè)簡(jiǎn)單的問(wèn)題。首先,系統(tǒng)中的節(jié)點(diǎn)受到能量限制,每個(gè)節(jié)點(diǎn)都有一個(gè)長(zhǎng)期的能量上限。其次,由于SL系統(tǒng)中的節(jié)點(diǎn)所持有的數(shù)據(jù)集、物理硬件各不相同,不恰當(dāng)?shù)墓?jié)點(diǎn)選擇可能會(huì)對(duì)訓(xùn)練效果產(chǎn)生負(fù)面影響[4]。最后,SL系統(tǒng)中的各個(gè)節(jié)點(diǎn)通常是通過(guò)無(wú)線網(wǎng)絡(luò)相互連接,而無(wú)線網(wǎng)絡(luò)狀態(tài)通常是時(shí)變的,因此需要考慮無(wú)線網(wǎng)絡(luò)質(zhì)量對(duì)模型參數(shù)傳輸?shù)挠绊憽?/p>
本文采用李雅普諾夫優(yōu)化[5](Lyapunov Optimization)管理各節(jié)點(diǎn)的能量消耗以使總能耗不超過(guò)長(zhǎng)期的能量上限,并結(jié)合組合多臂賭博機(jī)[6-12](Combinatorial Multi-Armed Bandit,CMAB)動(dòng)態(tài)感知各節(jié)點(diǎn)的性能狀況與無(wú)線網(wǎng)絡(luò)狀態(tài),綜合多種信息選擇合適的節(jié)點(diǎn)組合參與模型訓(xùn)練。
本節(jié)對(duì)相關(guān)工作進(jìn)行分類和討論,然后指出本文工作與它們的不同之處。與SL系統(tǒng)中的節(jié)點(diǎn)選擇問(wèn)題直接相關(guān)的文獻(xiàn)極少,而與之高度相關(guān)的問(wèn)題是聯(lián)邦學(xué)習(xí)中的客戶端節(jié)點(diǎn)選擇問(wèn)題,相關(guān)文獻(xiàn)總結(jié)如下:
文獻(xiàn)[13]使用節(jié)點(diǎn)反饋的信息(例如無(wú)線信道狀態(tài)、算力資源以及與當(dāng)前訓(xùn)練任務(wù)相關(guān)的數(shù)據(jù)資源的大小)來(lái)估計(jì)模型下載、更新和上傳所需的時(shí)間,并設(shè)計(jì)了一種基于上述時(shí)間的算法,以在規(guī)定的時(shí)間內(nèi)使盡可能多的節(jié)點(diǎn)參與模型訓(xùn)練,并將問(wèn)題建模為0~1背包問(wèn)題使用貪婪(greedy)算法求解。類似的文獻(xiàn)[14]以CPU、內(nèi)存和能量等的“資源效用函數(shù)”為約束,并基于線性回歸對(duì)其進(jìn)行預(yù)測(cè)。通過(guò)證明,其問(wèn)題可以簡(jiǎn)化為經(jīng)典的背包問(wèn)題,并使用貪婪算法在每一輪中盡可能多地選擇滿足資源效用約束的節(jié)點(diǎn)來(lái)求解。
文獻(xiàn)[15]考慮了節(jié)點(diǎn)的能量上限和無(wú)線信道條件。該工作采用了李雅普諾夫優(yōu)化,定義虛擬能量隊(duì)列來(lái)管理節(jié)點(diǎn)的能量消耗,并定義了基于節(jié)點(diǎn)的數(shù)據(jù)集大小和虛擬能量隊(duì)列的效用函數(shù)。該工作定義的問(wèn)題是在帶寬限制的約束下最大化效用函數(shù)的優(yōu)化。通過(guò)基于隊(duì)列長(zhǎng)度和信道增益的“選擇優(yōu)先級(jí)”來(lái)確定每一輪選擇哪些節(jié)點(diǎn)。文獻(xiàn)[16]也考慮了帶寬限制的問(wèn)題,并且更加關(guān)注無(wú)線資源分配問(wèn)題,定義了節(jié)點(diǎn)的“經(jīng)驗(yàn)損失函數(shù)”,并將其問(wèn)題建模為帶寬受限的隨機(jī)優(yōu)化問(wèn)題。通過(guò)引入李雅普諾夫優(yōu)化,將原問(wèn)題轉(zhuǎn)化為在線問(wèn)題并在每一輪求解隨機(jī)優(yōu)化問(wèn)題。
文獻(xiàn)[17]考慮了訓(xùn)練時(shí)延、節(jié)點(diǎn)可用性和選擇的公平性,設(shè)計(jì)了基于訓(xùn)練時(shí)延的獎(jiǎng)勵(lì)函數(shù),在CMAB的理論框架下對(duì)問(wèn)題進(jìn)行轉(zhuǎn)化并使用經(jīng)典CMAB算法—UCB1[18]求解。文獻(xiàn)[19]研究了節(jié)點(diǎn)選擇的公平性對(duì)模型訓(xùn)練性能的影響,并定義了一個(gè)名為“模型交換時(shí)間”(Model Exchange Time)的指標(biāo),包含模型下載時(shí)間、訓(xùn)練時(shí)間和模型上傳時(shí)間。最后設(shè)計(jì)了基于上下文CMAB的算法,以保證選擇公平性為約束最小化“模型交換時(shí)間”。
本文的研究工作不同于上述文獻(xiàn)。文獻(xiàn)[15-16]主要關(guān)注無(wú)線資源分配問(wèn)題,而這在SL系統(tǒng)中是不切實(shí)際的,因?yàn)闊o(wú)線資源相關(guān)的信息在實(shí)際SL系統(tǒng)中無(wú)法獲取。文獻(xiàn)[13-14]定義了類基于線性回歸預(yù)測(cè)的指標(biāo)來(lái)選擇節(jié)點(diǎn),而類似線性回歸方法無(wú)法很好地反映相關(guān)指標(biāo)的真實(shí)狀態(tài)。與本文工作最相近的是文獻(xiàn)[17-19],雖然考慮了訓(xùn)練時(shí)延和選擇的公平性,但忽略了節(jié)點(diǎn)的能量消耗。綜上所述,現(xiàn)有的研究都沒(méi)有考慮長(zhǎng)期的異構(gòu)能量約束下的節(jié)點(diǎn)選擇問(wèn)題。
圖1 集群學(xué)習(xí)系統(tǒng)Fig.1 Swarm learning system
在實(shí)際的SL系統(tǒng)整個(gè)訓(xùn)練過(guò)程前的初始化階段中,所有節(jié)點(diǎn)均會(huì)參與一次模型訓(xùn)練以獲取各個(gè)節(jié)點(diǎn)的初始性能信息。在之后的每一輪訓(xùn)練開始前,領(lǐng)導(dǎo)者節(jié)點(diǎn)基于各個(gè)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài)、歷史訓(xùn)練時(shí)延以及能耗表現(xiàn)綜合選擇合適的節(jié)點(diǎn)組合參與本輪訓(xùn)練。
SL系統(tǒng)分為中間件和應(yīng)用層[2],中間件負(fù)責(zé)管理無(wú)線網(wǎng)絡(luò)通信相關(guān)問(wèn)題。然而,由于無(wú)線網(wǎng)絡(luò)的時(shí)變特性,參數(shù)傳輸過(guò)程可能出現(xiàn)錯(cuò)誤進(jìn)而影響整體訓(xùn)練的效率。為解決這一問(wèn)題,將Di(t)設(shè)置為一個(gè)上限D(zhuǎn)max。如果某節(jié)點(diǎn)因?yàn)榫W(wǎng)絡(luò)問(wèn)題導(dǎo)致模型傳輸失敗,則將其對(duì)應(yīng)的Di(t)設(shè)置為Dmax,同時(shí)在參數(shù)合并時(shí)忽略該節(jié)點(diǎn),Dmax的值根據(jù)訓(xùn)練模型的不同由實(shí)際需要確定。
(1)
(2)
式中,Ⅱ{·}為指示函數(shù),即條件為真其值取1否則取0。約束條件(1)為長(zhǎng)期的能耗約束,其含義為各個(gè)節(jié)點(diǎn)的總能耗不能超過(guò)其先驗(yàn)上限。約束條件(2)表示參與每個(gè)全局模型訓(xùn)練的節(jié)點(diǎn)數(shù)量均為k。
問(wèn)題(P1)可以簡(jiǎn)化為一個(gè)標(biāo)準(zhǔn)的背包問(wèn)題,其中各個(gè)節(jié)點(diǎn)的能量上限對(duì)應(yīng)于背包的容量;節(jié)點(diǎn)每一輪的能耗對(duì)應(yīng)于物品的重量,uj(t)是物品的價(jià)值,因此問(wèn)題(P1)是一個(gè)NP難問(wèn)題。此外,質(zhì)量函數(shù)的具體值只有在節(jié)點(diǎn)實(shí)際進(jìn)行模型訓(xùn)練后才能觀察到。然而,領(lǐng)導(dǎo)者節(jié)點(diǎn)需要在實(shí)際的訓(xùn)練開始之前進(jìn)行節(jié)點(diǎn)選擇,而此時(shí)質(zhì)量函數(shù)的實(shí)際值尚不可獲取。因此,問(wèn)題(P1)無(wú)法離線求得最優(yōu)解。為了求解問(wèn)題(P1),本文在 CMAB 理論框架下將該離線問(wèn)題轉(zhuǎn)化為逐輪在線問(wèn)題并求得次優(yōu)解。
采用CMAB理論的思路,將問(wèn)題(P1)轉(zhuǎn)化為在線形式。定義質(zhì)量函數(shù)的“置信上界”如下:
(3)
式中,
(4)
s.t.(1),(2)
。
根據(jù)文獻(xiàn)[21],CMAB算法在經(jīng)過(guò)數(shù)輪迭代后會(huì)傾向于選擇某些特定的節(jié)點(diǎn)組合,使這些節(jié)點(diǎn)的能量快速耗盡而無(wú)法繼續(xù)參與訓(xùn)練。因此,本文引入李雅普諾夫優(yōu)化機(jī)制來(lái)平衡節(jié)點(diǎn)被選中的頻率。定義節(jié)點(diǎn)i的能量赤字隊(duì)列如下:
(5)
式中,[·]+=max{·,0},Ⅱi,j(t)=Ⅱ{i∈Sj(t)}。T0為訓(xùn)練輪數(shù)的上界,實(shí)際系統(tǒng)中可將其設(shè)置為歷史訓(xùn)練的最大輪數(shù)。初始的能量赤字隊(duì)列Θi(t)為0,當(dāng)某節(jié)點(diǎn)被頻繁選中時(shí),其對(duì)應(yīng)的Θi(t)將快速增大,反之則Θi(t)將保持較小值。通過(guò)最小化被選中節(jié)點(diǎn)的總能量赤字隊(duì)列,可間接控制各個(gè)節(jié)點(diǎn)被選中的頻率。同時(shí),通過(guò)最小化被選中節(jié)點(diǎn)的能量赤字隊(duì)列也可以控制節(jié)點(diǎn)的能量消耗,使其不超過(guò)能量上限。根據(jù)文獻(xiàn)[5],約束條件(1)自然得到滿足只需能量赤字隊(duì)列保持穩(wěn)定,即:
(6)
本文給出定理1證明上述陳述。
定理1若整個(gè)集群學(xué)習(xí)過(guò)程中的所有節(jié)點(diǎn)的能量赤字隊(duì)列保持穩(wěn)定,則長(zhǎng)期能量約束(1)始終滿足。
證:根據(jù)文獻(xiàn)[5]中的定理2.5,若整個(gè)集群學(xué)習(xí)過(guò)程中的所有能量赤字隊(duì)列Θi(t)保持穩(wěn)定,則有:
(7)
將CMAB與李雅普諾夫優(yōu)化結(jié)合,重新定義節(jié)點(diǎn)的質(zhì)量函數(shù)如下:
qi(t)=V·Di(t)+Θi(t)ci(t)。
(8)
qi(t)的估計(jì)值為:
(9)
(10)
基于上述定義,給出問(wèn)題的最終形式:
s.t.(6),(2)
。
問(wèn)題(P3)可以通過(guò)對(duì)所有節(jié)點(diǎn)的質(zhì)量函數(shù)值排序并選擇其中最小的K個(gè)求解出相應(yīng)的節(jié)點(diǎn)集合。
為了求解問(wèn)題(P3),提出了能量感知的節(jié)點(diǎn)選擇算法(Energy Aware Node Selection,EANS)。將問(wèn)題建模為異質(zhì)能量約束的 CMAB 問(wèn)題,其中節(jié)點(diǎn)對(duì)應(yīng)多臂賭博機(jī)的“臂(arm)”,訓(xùn)練時(shí)延對(duì)應(yīng)“獎(jiǎng)勵(lì)(reward)”,選擇節(jié)點(diǎn)對(duì)應(yīng)選擇arm。為了處理異質(zhì)能量約束,將李雅普諾夫優(yōu)化與 CMAB 算法結(jié)合,通過(guò)最小化本文定義的虛擬能量赤字隊(duì)列并確保其保持穩(wěn)定,使得各個(gè)節(jié)點(diǎn)的總能耗不超過(guò)其能量上限。
EANS算法由初始化和主循環(huán)2個(gè)階段構(gòu)成。在第1行所示的初始化階段中,領(lǐng)導(dǎo)者節(jié)點(diǎn)選擇所有節(jié)點(diǎn)進(jìn)行一次模型訓(xùn)練并收集各節(jié)點(diǎn)反饋的時(shí)延Di(t)和能量消耗ci(t),用以初始化算法。如第 3 行所示,此后的每一輪領(lǐng)導(dǎo)者節(jié)點(diǎn)對(duì)所有節(jié)點(diǎn)上一輪的質(zhì)量函數(shù)值進(jìn)行排序,選擇上一輪質(zhì)量函數(shù)值最小的K個(gè)節(jié)點(diǎn)參與本輪的模型訓(xùn)練。這K個(gè)節(jié)點(diǎn)按照質(zhì)量函數(shù)值升序分成每k個(gè)一組,如圖2所示。
圖2 節(jié)點(diǎn)組合的劃分方式Fig.2 Assignment of node groups
完成節(jié)點(diǎn)選擇后,第4行調(diào)用算法2分配節(jié)點(diǎn)組合至每個(gè)全局模型。之后各個(gè)被選中的節(jié)點(diǎn)在本地進(jìn)行模型訓(xùn)練,并上傳訓(xùn)練后的模型(第5行)。節(jié)點(diǎn)完成訓(xùn)練后領(lǐng)導(dǎo)者節(jié)點(diǎn)會(huì)對(duì)本輪被選中的節(jié)點(diǎn)的訓(xùn)練時(shí)延和能耗進(jìn)行收集,并更新對(duì)應(yīng)的質(zhì)量函數(shù)(第6,7行)。
由于每個(gè)節(jié)點(diǎn)所持的數(shù)據(jù)不同,每個(gè)全局模型所需的數(shù)據(jù)也可能不同。因此,需要設(shè)計(jì)一個(gè)算法,盡可能將持有全局模型所需數(shù)據(jù)的節(jié)點(diǎn)分配給對(duì)應(yīng)的模型。本文提出算法2來(lái)確定全局模型和節(jié)點(diǎn)組合之間的對(duì)應(yīng)關(guān)系。
證明圖2所示的劃分方式是問(wèn)題(P3)的可行解,同時(shí)給出虛擬能量赤字隊(duì)列的上界以證明虛擬能量赤字隊(duì)列的穩(wěn)定性。
證:設(shè)任意一種將K個(gè)被選節(jié)點(diǎn)分為k個(gè)一組的序列為S′j(t),j=1,2,…,J。為描述方便,不妨設(shè)任意S′j(t)中的節(jié)點(diǎn)按其質(zhì)量函數(shù)值升序排列,則有:
由于SGmj(t)序列按質(zhì)量函數(shù)值升序得到,因此顯然存在以下關(guān)系:
由S′j(t)序列的任意性可得出SGmj(t)序列是問(wèn)題(P3)的一種可行解。定理2證畢。
在證明虛擬能量赤字隊(duì)列的穩(wěn)定性之前,需要介紹一個(gè)假設(shè):
假設(shè) 1 的含義為節(jié)點(diǎn)有足夠的能量參與全程SL的訓(xùn)練過(guò)程。有了上面的假設(shè),給出式(6)的嚴(yán)格上界,如下所示:
(11)
式中,
證:
首先,定義如下符號(hào):
求解Lyapunov drift的上界:
(12)
對(duì)式(12)兩端從t=1,2,…,T求和,除以T再放縮可得:
(13)
對(duì)式(13)中的T取極限,兩端除以ε即可得定理3。定理3證畢。
本文實(shí)驗(yàn)在一臺(tái)搭載Intel Xeon E5 CPU、32 GB RAM、2 TB HDD、512 GB SSD和Ubuntu 16.04.1 LTS 操作系統(tǒng)的桌面服務(wù)器上進(jìn)行。使用Flower[23]平臺(tái)構(gòu)建SL框架。采用Docker容器模擬了20個(gè)節(jié)點(diǎn),各節(jié)點(diǎn)的能量上限1 300~1 600 J隨機(jī)變化。使用擴(kuò)展的手寫數(shù)字分類數(shù)據(jù)集 EMNIST[24]進(jìn)行模型訓(xùn)練。EMNIST 的數(shù)字部分包含10個(gè)類別的28 pixel×28 pixel灰度圖像,訓(xùn)練集包含240 000條數(shù)據(jù),測(cè)試集包含40 000條數(shù)據(jù)。本文將訓(xùn)練集中的240 000條數(shù)據(jù)和測(cè)試集中的 32 000條數(shù)據(jù)組合在一起,并將其分成 20 組作為20個(gè)節(jié)點(diǎn)的訓(xùn)練集。剩余的8 000條數(shù)據(jù)用作所有節(jié)點(diǎn)的測(cè)試集。
通過(guò)實(shí)驗(yàn)評(píng)估了EANS的能量赤字隊(duì)列、總能量消耗、訓(xùn)練時(shí)延等指標(biāo)。由于本文算法采用了CMAB框架,則對(duì)比算法也應(yīng)該在CMAB的框架下,否則不具有可比性。因此本文與以下2種常見算法比較以評(píng)估EANS算法的性能。
(1) 隨機(jī)算法Random:隨機(jī)選擇每一輪由哪K個(gè)節(jié)點(diǎn)參與訓(xùn)練;
(2) 文獻(xiàn)[17]提出的用于聯(lián)邦學(xué)習(xí)中客戶端節(jié)點(diǎn)選擇的CS-UCB-Q算法:中心服務(wù)器在fairness約束下選擇延遲最小的節(jié)點(diǎn)(參見文獻(xiàn)[17]中的不等式6)。
圖3 展示了能量赤字隊(duì)列隨輪次t的趨勢(shì)。由圖3可見,能量赤字隊(duì)列先增加后減小,最后趨于穩(wěn)定。此外,隨著參數(shù)V的增加,能量赤字隊(duì)列的上界也增加,這證明定理3是正確的。
圖3 能量赤字隊(duì)列在不同V值下的趨勢(shì)Fig.3 Trend of energy deficit queue vs round under different V
本文評(píng)估了EANS算法在不同情況下能量消耗的表現(xiàn),并與CS-UCB-Q和Random進(jìn)行了比較,如圖4所示。由于CS-UCB-Q沒(méi)有考慮能量的影響[17],在不同的參數(shù)V設(shè)置下,其能量消耗接近隨機(jī)算法Random,并且明顯高于EANS算法。
圖4 幾種算法的能量消耗趨勢(shì)Fig.4 Trend of energy consumption of different algorithms vs round
由圖4可以看出,當(dāng)V=200時(shí),EANS算法的能耗為CS-UCB-Q算法能耗的54.6%,而當(dāng)V=10時(shí),能耗僅為CS-UCB-Q的45.5%。與隨機(jī)算法Random相比,EANS算法在V=200時(shí)能耗僅為Random能耗的54.0%,在V=10時(shí)為45.0%。
圖5展示了EANS算法在不同情況下訓(xùn)練時(shí)延的表現(xiàn),以及與CS-UCB-Q和Random的對(duì)比。由于 CS-UCB-Q更關(guān)注訓(xùn)練時(shí)延而EANS不僅考慮了訓(xùn)練時(shí)延還考慮了能量消耗,需要在二者中做出權(quán)衡,因此CS-UCB-Q的總訓(xùn)練時(shí)延比EANS的要小。
圖5 幾種算法的訓(xùn)練時(shí)延在不同V值下的趨勢(shì)Fig.5 Trend of training delay of different algorithms vs round under different V
由圖5可以看出,EANS算法的總訓(xùn)練時(shí)延比參數(shù)V=10時(shí)的CS-UCB-Q多44%,而當(dāng)參數(shù)V=200時(shí),EANS算法的總訓(xùn)練時(shí)延僅比CS-UCB-Q多19%。同樣地,由于EANS算法在參數(shù)V較小時(shí)更關(guān)注能量消耗的影響,因此EANS的訓(xùn)練時(shí)延比隨機(jī)算法Random大,而當(dāng)參數(shù)V變大時(shí),EANS算法的訓(xùn)練時(shí)延表現(xiàn)則優(yōu)于隨機(jī)算法Random。
本文提出一種新的用于集群學(xué)習(xí)的節(jié)點(diǎn)選擇算法——EANS算法,該算法考慮了無(wú)線網(wǎng)絡(luò)質(zhì)量對(duì)集群學(xué)習(xí)系統(tǒng)整體訓(xùn)練效率的影響,著重關(guān)注了模型訓(xùn)練時(shí)延和能量消耗。采用CMAB理論結(jié)合李雅普諾夫優(yōu)化的方法在無(wú)需節(jié)點(diǎn)詳細(xì)性能信息的情況下為模型訓(xùn)練選擇次優(yōu)的節(jié)點(diǎn)組合,在保證整體訓(xùn)練效率的同時(shí)控制節(jié)點(diǎn)能量消耗不超過(guò)其能量上限。
從實(shí)驗(yàn)結(jié)果可以看出,EANS算法可達(dá)到接近最優(yōu)解的性能。在能耗方面,當(dāng)V=200時(shí),EANS的能耗為CS-UCB-Q的54.6%,而當(dāng)V=10時(shí)僅為CS-UCB-Q的45.5%。與隨機(jī)算法Random相比,EANS算法的能耗是隨機(jī)算法的54.0%而V=10時(shí)僅為其45.0%。
未來(lái)的工作,將考慮在節(jié)點(diǎn)選擇的目標(biāo)函數(shù)中引入模型的準(zhǔn)確度,更加真實(shí)地反映節(jié)點(diǎn)的性能。同時(shí),考慮對(duì)節(jié)點(diǎn)的能耗進(jìn)行更加精確的建模,以使目標(biāo)函數(shù)能更加全面地反映節(jié)點(diǎn)的真實(shí)狀態(tài)。