摘 要: 網(wǎng)絡(luò)資源調(diào)度過程中存在多處理機(jī)同時發(fā)生故障的情況,傳統(tǒng)方法在處理多處理機(jī)發(fā)生故障時,主要分析執(zhí)行時間和通信時間,未對資源調(diào)度的穩(wěn)定性進(jìn)行考慮,資源調(diào)度存在較高的誤差。為了有效解決資源調(diào)度過程中存在的故障問題,設(shè)計了基于自適應(yīng)容錯機(jī)制的網(wǎng)絡(luò)資源調(diào)度平臺。該平臺具有網(wǎng)絡(luò)資源發(fā)現(xiàn)、網(wǎng)絡(luò)網(wǎng)絡(luò)資源預(yù)約、網(wǎng)絡(luò)資源動態(tài)信息查詢以及資源調(diào)度運行時監(jiān)控等功能。網(wǎng)絡(luò)資源調(diào)度模塊的錯誤檢測服務(wù)包括進(jìn)程監(jiān)控模塊、匯總模塊、錯誤評估模塊以及報警模塊。通過自適應(yīng)錯誤檢測算法,對網(wǎng)絡(luò)資源調(diào)度進(jìn)程中的錯誤進(jìn)行檢測,并采取對應(yīng)的解決措施,確保資源調(diào)度的順利運行。實驗結(jié)果說明,所設(shè)計調(diào)度平臺在進(jìn)行資源調(diào)度過程中,網(wǎng)絡(luò)利用率、調(diào)度性能以及可靠性都較優(yōu)。
關(guān)鍵詞: 容錯機(jī)制; 網(wǎng)絡(luò)資源; 資源調(diào)度; 錯誤檢測服務(wù)
中圖分類號: TN915?34; TP393 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2016)10?0061?04
Design of network resource scheduling platform based on adaptive
fault?tolerant mechanism
HAN Min, QIAO Lu
(Department of Information Engineering, Henan PolyTechnic, Zhengzhou 450046, China)
Abstract: In order to effectively solve the fault problems existing in the process of resource scheduling, a network resource scheduling platform based on adaptive fault?tolerant mechanism was designed. The platform has the functions of network resource discovery, network resource appointment, network resources dynamic information query, resource scheduling run?time monitoring, etc. The error detection service of the network resource scheduling includes process monitoring module, summary module, error evaluation module and alarm module. The error in the process of the network resource scheduling is detected with the adaptive error detection algorithm, and the corresponding measures are taken to ensure the smooth operation of the resource scheduling. The experiment result shows that the platform has high network utilization, perfect scheduling performance and better reliability in the process of resource scheduling,.
Keywords: fault?tolerance mechanism; network resource; resource scheduling; error detection service
0 引 言
隨著科學(xué)技術(shù)和通信技術(shù)的高速發(fā)展,網(wǎng)絡(luò)已經(jīng)成為人們生產(chǎn)和生活必不可少的一部分,網(wǎng)絡(luò)資源的高效調(diào)度對于提高生產(chǎn)和生活質(zhì)量具有重要作用。而網(wǎng)絡(luò)資源調(diào)度過程中存在多處理機(jī)同時發(fā)生故障的情況,傳統(tǒng)方法處理多處理機(jī)發(fā)生故障,主要分析執(zhí)行時間和通信時間,未對資源調(diào)度的穩(wěn)定性進(jìn)行考慮,資源調(diào)度存在較高的誤差[1?3]。網(wǎng)絡(luò)資源調(diào)度的高可靠性是系統(tǒng)內(nèi)在要求的關(guān)鍵,容錯調(diào)度是調(diào)度系統(tǒng)實現(xiàn)容錯的有效方法。因此,考慮容錯機(jī)制,設(shè)計出高質(zhì)量的網(wǎng)絡(luò)資源調(diào)度平臺,具有重要應(yīng)用意義[4?5]。
文獻(xiàn)[6]分析了依據(jù)可靠性驅(qū)動的動態(tài)網(wǎng)絡(luò)資源調(diào)度方法,該方法在大量資源失敗條件下,基于資源調(diào)度可靠性代價為目標(biāo),實現(xiàn)非周期的的動態(tài)資源實時調(diào)度,但是該方法的調(diào)度效率較低。文獻(xiàn)[7]提出了基于主動復(fù)制策略的List啟發(fā)式調(diào)度算法,其可將一個資源的N+l個副本調(diào)度到不同處理機(jī),但是在劃分資源的大規(guī)模副本時,產(chǎn)生了較高的通信消耗和時間復(fù)雜度。文獻(xiàn)[8]在啟發(fā)式調(diào)度算法基礎(chǔ)上,采用新的數(shù)據(jù)結(jié)構(gòu)處理網(wǎng)絡(luò)資源映射到的處理機(jī)間的通信關(guān)系,降低大量冗余通信,但是存在調(diào)度誤差高的缺陷。文獻(xiàn)[9]中的CAFT資源調(diào)度方法,其重復(fù)考慮資源調(diào)度的時間復(fù)雜度,將資源多個副本映射到不同的處理機(jī)上,但是該方法在調(diào)度資源過程中的穩(wěn)定性較差。
本文設(shè)計了基于自適應(yīng)容錯機(jī)制的網(wǎng)絡(luò)資源調(diào)度平臺,該平臺具有網(wǎng)絡(luò)資源發(fā)現(xiàn)、網(wǎng)絡(luò)網(wǎng)絡(luò)資源預(yù)約、網(wǎng)絡(luò)資源動態(tài)信息查詢以及資源調(diào)度運行時監(jiān)控等功能。
1 網(wǎng)絡(luò)資源調(diào)度平臺的邏輯設(shè)計
1.1 網(wǎng)絡(luò)資源高度平臺的總體結(jié)構(gòu)
網(wǎng)絡(luò)資源調(diào)度平臺的總體結(jié)構(gòu)如圖1所示。
在圖1所示的網(wǎng)絡(luò)資源調(diào)度結(jié)構(gòu)中,網(wǎng)絡(luò)資源提交者將資源提交給資源調(diào)度程序,資源調(diào)度程序從其中的等待調(diào)度資源序列中采集有關(guān)待調(diào)度網(wǎng)絡(luò)資源的反映信息以及資源申請信息,在資源提供者中搜索相關(guān)的網(wǎng)絡(luò)需求。網(wǎng)絡(luò)資源調(diào)度模塊中的資源匹配子模塊能夠?qū)Y源進(jìn)行匹配分析。資源管理模塊將現(xiàn)場網(wǎng)絡(luò)資源調(diào)度模塊中采集到的網(wǎng)絡(luò)現(xiàn)場資源,傳輸給資源提交模塊,實現(xiàn)網(wǎng)絡(luò)資源的有效調(diào)度,并將調(diào)度結(jié)果存儲在數(shù)據(jù)庫中,同時通過調(diào)度結(jié)果顯示模塊向用戶提供網(wǎng)絡(luò)資源調(diào)度結(jié)果。
1.2 基于自適應(yīng)容錯機(jī)制的網(wǎng)絡(luò)資源調(diào)度模型設(shè)計
隨著網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大,網(wǎng)絡(luò)資源調(diào)度故障發(fā)生率逐漸增加,引入自適應(yīng)容錯機(jī)制實時檢測故障,有效處理故障形成的不利干擾,確保網(wǎng)絡(luò)資源調(diào)度的順利進(jìn)行。
1.2.1 錯誤檢測服務(wù)的設(shè)計
錯誤檢測服務(wù)是自適應(yīng)容錯機(jī)制的關(guān)鍵部分,其可實時采集網(wǎng)絡(luò)故障資源節(jié)點,同時將錯誤信息傳遞到錯誤調(diào)控服務(wù),通過錯誤控制服務(wù)制定解決方案,完成錯誤的恢復(fù),最終實現(xiàn)網(wǎng)絡(luò)資源調(diào)度容錯性能。錯誤檢測服務(wù)包括進(jìn)程監(jiān)控模塊、匯總模塊、錯誤評估模塊和報警模塊,其結(jié)構(gòu)圖如圖2所示。圖2所示的基于自適應(yīng)容錯機(jī)制的網(wǎng)絡(luò)資源調(diào)度模塊的容錯檢測服務(wù)過程為:
(1) 進(jìn)程監(jiān)測模塊可檢測到網(wǎng)絡(luò)中運行的進(jìn)程以及對應(yīng)的資源,采用故障機(jī)制檢測網(wǎng)絡(luò)資源調(diào)度進(jìn)程的情況,通過將故障信息傳遞給匯總模塊。
(2) 匯總模塊用于采集進(jìn)程監(jiān)測模塊傳遞的故障信息,采用合理的方案評估故障信息達(dá)到世界的歷史信息,分析后續(xù)故障信息到達(dá)的時間。
(3) 錯誤評估模塊對網(wǎng)絡(luò)資源調(diào)度平臺是否存在錯誤進(jìn)行評估,該模塊對服務(wù)器預(yù)測的下次故障信息以及故障信息實際到達(dá)的實際進(jìn)行匹配,基于該匹配結(jié)果評估是否存在資源調(diào)度錯誤。
(4) 通信模塊在存在網(wǎng)絡(luò)資源調(diào)度錯誤情況下,將錯誤信息傳輸?shù)皆嬎隳夸浤K以及錯誤控制模塊。通信模塊能夠在網(wǎng)絡(luò)資源調(diào)度過程中對錯誤資源進(jìn)行標(biāo)識,并通過錯誤控制模塊針對發(fā)生的錯誤進(jìn)行合理的處理,確保網(wǎng)絡(luò)資源調(diào)度的順利運行。
1.2.2 錯誤檢測服務(wù)的實現(xiàn)
基于自適應(yīng)容錯機(jī)制的網(wǎng)絡(luò)資源調(diào)度模塊,通過自適應(yīng)錯誤檢測算法,檢測網(wǎng)絡(luò)資源調(diào)度進(jìn)程中存在的錯誤。自適應(yīng)錯誤檢測算法的思路為:檢測進(jìn)程P塑造一個滑動窗口其范圍是N,其用作描述近來N次故障消息的傳達(dá),所花費的時間,用t1,t2,…,tn來描述,在任意一個新增故障消息抵達(dá)的過程中,會更換掉最初記載的那個時間,通過以上時間的記載,則可獲取臨近兩次故障消息抵達(dá)的時間間隙Δt,如果故障消息抵達(dá)的時間間隙服從正態(tài)分布,則可預(yù)測出后續(xù)故障消息到達(dá)的時間概率,獲取待檢測進(jìn)程超出時間t的命中率,自適應(yīng)錯誤檢測算法中的猜測程度函數(shù)Φ的分析過程如下:
(1) 檢測網(wǎng)絡(luò)資源調(diào)度過程p中存儲待檢測過程q近期的N次傳遞的故障消息抵達(dá)時間為t1,t2,…,tn;
式中:[Φ(Tnow)]為若網(wǎng)絡(luò)資源調(diào)度平臺在時刻[Tnow],檢測網(wǎng)絡(luò)資源調(diào)度進(jìn)程p未獲取到待檢測進(jìn)程q反饋的故障消息,則進(jìn)程p確定進(jìn)程q存在故障的概率是[Φ(Tnow)]。檢測網(wǎng)絡(luò)資源調(diào)度平臺是否存在錯誤前,網(wǎng)絡(luò)資源調(diào)度進(jìn)程會基于資源調(diào)度平臺對錯誤檢測服務(wù)的要求,設(shè)置合理的閾值[α],因此,在檢測錯誤時,實時對比[Φ(Tnow)]值與[α]值,若[Φ(Tnow)]>[α],則說明被檢測的網(wǎng)絡(luò)資源調(diào)度進(jìn)程存在錯誤。
1.2.3 引入自適應(yīng)容錯機(jī)制的網(wǎng)絡(luò)資源調(diào)度算法
通過1.2.2節(jié)的計算結(jié)果,將錯誤檢測容錯機(jī)制引入網(wǎng)絡(luò)資源調(diào)度中,具體運行過程為:
(1) 用戶和網(wǎng)絡(luò)使用者將資源傳送至調(diào)度平臺,并放置在網(wǎng)絡(luò)待調(diào)度的列表中;
(2) 網(wǎng)絡(luò)信息服務(wù)依據(jù)容錯機(jī)制完成資源的檢測,得到有價值的資源列表;
(3) 網(wǎng)絡(luò)資源調(diào)試模塊依據(jù)有價值的資源列表完成資源調(diào)度;
(4) 開始調(diào)度網(wǎng)絡(luò)資源時,根據(jù)固定的時間段塑造檢驗點并恢復(fù)原始數(shù)據(jù)錯誤等級是1;
(5) 錯誤檢測模塊根據(jù)自適應(yīng)容錯機(jī)制檢測處理單元的錯誤,同時將檢查的信息反饋到錯誤決策模塊;
(6) 在故障消息超出設(shè)定時間后,錯誤決策模塊分析出存在錯誤,則執(zhí)行過程(7),否則說明不存在錯誤,執(zhí)行過程(8);
(7) 錯誤控制模塊基于NakedJoystick提取對應(yīng)的容錯方案:
① NakedJoystick=1時,利用檢測點與發(fā)生錯誤重試的容錯方案,同時設(shè)置NakedJoystick++;
② NakedJoystick=2時,利用檢測點與資源替換的容錯方案,同時設(shè)置NakedJoystick++;
③ NakedJoystick=3時代表出現(xiàn)了重大錯誤,這時要利用檢測點與資源復(fù)制的容錯方案;
④ 若無綜上情況發(fā)生就代表容錯機(jī)制運行失敗,資源實施也以失敗告終,執(zhí)行過程(9)。
(8) 分析是否完成網(wǎng)絡(luò)資源調(diào)度,若完成則執(zhí)行過程(9),否則執(zhí)行過程(6);
(9) 完成網(wǎng)絡(luò)資源調(diào)度,說明基于自適應(yīng)容錯機(jī)制的網(wǎng)絡(luò)資源調(diào)度過程結(jié)束。
1.2.4 代碼的設(shè)計與實現(xiàn)
基于自適應(yīng)容錯機(jī)制的網(wǎng)絡(luò)資源調(diào)度算法執(zhí)行過程代碼如下:
Begin
(1) 網(wǎng)絡(luò)信息服務(wù)依據(jù)資源描述信息獲取有價值的資源列表;
(2) 對GA_TS網(wǎng)絡(luò)資源進(jìn)行調(diào)度;
MistakeJoystick=2
while(網(wǎng)絡(luò)資源未實施結(jié)束)
if([t等待>Δt1])
在網(wǎng)絡(luò)信息服務(wù)里記錄發(fā)生錯誤的資源,同時從可用資源列表中清除;
if(MistakeJoystick==2)
JowlScore_Wound;
NakedJoystick++;
else
if(MistakeJoystick==2)
JowlScore_Substitute_Financial;
NakedJoystick++;
Clse
if(nakedJoystick==4)
JowlScore??HrUtilization:
else
容錯機(jī)制失效,網(wǎng)絡(luò)資源調(diào)度失?。?/p>
endif
endif
endif
endwhile
end
2 實驗分析
通過實驗驗證本文提出的基于自適應(yīng)容錯機(jī)制的網(wǎng)絡(luò)資源調(diào)度平臺設(shè)計方法的性能。實驗采用的對比方法為神經(jīng)網(wǎng)絡(luò)方法。實驗從網(wǎng)絡(luò)利用率、調(diào)度性和可靠性三方面評估本文方法和神經(jīng)網(wǎng)絡(luò)方法的優(yōu)劣。兩種方法的網(wǎng)絡(luò)利用率的實驗結(jié)果如圖3所示。
圖3 兩種方法的網(wǎng)絡(luò)利用率對比
從圖3中可看出,網(wǎng)絡(luò)利用率在開始階段,兩種調(diào)度方法的網(wǎng)絡(luò)利用率都相對較高,但是隨著調(diào)度時間的逐漸增加,兩種方法的網(wǎng)絡(luò)利用率都不斷降低,并且本文方法的網(wǎng)絡(luò)利用率始終高于神經(jīng)網(wǎng)絡(luò)方法,本文方法能夠充分利用網(wǎng)絡(luò)資源完成網(wǎng)絡(luò)資源的調(diào)度。并且本文方法的變化趨于平穩(wěn),說明本文方法能夠很好地完成網(wǎng)絡(luò)資源的調(diào)度,具有較高的調(diào)度均衡性。
如圖4所示為兩種方法的調(diào)度性表現(xiàn),分析圖4可以看出,隨著資源數(shù)的增加,本文方法和神經(jīng)網(wǎng)絡(luò)方法的調(diào)度性逐漸降低,并且神經(jīng)網(wǎng)絡(luò)方法的調(diào)度性能出現(xiàn)顯著的波動,但本文方法的調(diào)度性高于神經(jīng)網(wǎng)絡(luò)方法,表明在多資源調(diào)度環(huán)境下本文方法具有較強(qiáng)的健壯性。
如圖5所示為不同網(wǎng)絡(luò)資源調(diào)度失敗比率條件下,兩種調(diào)度方法的可靠性。從圖5中能夠分析出:隨著資源調(diào)度失敗比率的不斷增加,兩種方法的可靠性都有所下降,但是本文方法的可靠性遠(yuǎn)遠(yuǎn)優(yōu)于神經(jīng)網(wǎng)絡(luò)方法,特別當(dāng)通信延遲較高時,說明本文方法具有較高的可靠性。
3 結(jié) 論
為了有效解決資源調(diào)度過程中存在的故障問題,本文設(shè)計了基于自適應(yīng)容錯機(jī)制的網(wǎng)絡(luò)資源調(diào)度平臺。該平臺具有網(wǎng)絡(luò)資源發(fā)現(xiàn)、網(wǎng)絡(luò)資源預(yù)約、網(wǎng)絡(luò)資源動態(tài)信息查詢和資源調(diào)度運行時監(jiān)控等功能。網(wǎng)絡(luò)資源調(diào)度模塊的錯誤檢測服務(wù)包括進(jìn)程監(jiān)控模塊、匯總模塊、錯誤評估模塊以及報警模塊。通過自適應(yīng)錯誤檢測算法,對網(wǎng)絡(luò)資源調(diào)度進(jìn)程中的錯誤進(jìn)行檢測,并采取對應(yīng)的解決措施,確保資源調(diào)度的順利運行。實驗結(jié)果表明,所設(shè)計調(diào)度平臺在進(jìn)行資源調(diào)度過程中,網(wǎng)絡(luò)利用率、調(diào)度性能以及可靠性都較優(yōu)。
參考文獻(xiàn)
[1] 華楠,鄭小平.智能光網(wǎng)絡(luò)發(fā)展歷程的回顧和展望:從ASON到PCE,再到SDON[J].電信科學(xué),2014,30(2):88?98.
[2] 彭彬,于浩,蘇韻掣,等.基于物聯(lián)網(wǎng)的智能廠站位置服務(wù)系統(tǒng)[J].電力系統(tǒng)自動化,2013,37(16):114?118.
[3] 魯睿,鄭小平,華楠.多域異構(gòu)光網(wǎng)絡(luò)互連互通管控機(jī)制[J].清華大學(xué)學(xué)報(自然科學(xué)版),2013(7):982?990.
[4] WEI Yongjian, GUO Junhu, LI Hui, et al. Experimental demonstration of centralized control mechanism over all?optical network based on OpenFlow protocol [C]// 2014 Optical Fiber Communications Conference and Exhibition. San Francisco, CA: OFC, 2014: 1?9.
[5] 真才基.TD?LTE網(wǎng)絡(luò)規(guī)劃原理與應(yīng)用[M].北京:人民郵電出版社,2013:57?59.
[6] 孫維成.云資源調(diào)度技術(shù)在區(qū)域醫(yī)療衛(wèi)生信息平臺中的應(yīng)用研究[D].青島:中國海洋大學(xué),2013:19?21.
[7] 汪楠.基于OpenStack云平臺的計算資源動態(tài)調(diào)度及管理[D].大連:大連理工大學(xué),2013:45?50.
[8] 敖文鳳.云計算中基于Hungarian算法的資源獲取研究[D].成都:電子科技大學(xué),2013:21?24.
[9] 石華.異構(gòu)無線網(wǎng)絡(luò)中頻譜資源動態(tài)分配[D].西安:西安電子科大學(xué),2014.