唐月霞
(上海市奉賢區(qū)中心醫(yī)院信息管理和統(tǒng)計處 上海201499)
面向行政管理系統(tǒng)的任務(wù)調(diào)度算法研究
唐月霞
(上海市奉賢區(qū)中心醫(yī)院信息管理和統(tǒng)計處 上海201499)
為了更好地解決云計算在行政管理系統(tǒng)任務(wù)調(diào)度交互數(shù)據(jù)量大的問題,本研究在綜合遺傳算法與退火算法的優(yōu)點(diǎn)基礎(chǔ)上提出了一種遺傳退火混合算法。該算法針對行政管理系統(tǒng)中的任務(wù)調(diào)度數(shù)據(jù)關(guān)系特點(diǎn),在云計算環(huán)境下對執(zhí)行任務(wù)進(jìn)行整數(shù)編碼,通過遺傳算法的適應(yīng)度函數(shù)對任務(wù)數(shù)據(jù)進(jìn)行全局最優(yōu)解的搜索,任務(wù)數(shù)據(jù)的編碼交叉重組過程中,利用退火算法調(diào)整適應(yīng)函數(shù)的方式加快系統(tǒng)虛擬機(jī)對任務(wù)調(diào)度的完成時間。實(shí)驗(yàn)表明,該任務(wù)調(diào)度算法適應(yīng)度值高于傳統(tǒng)遺傳算法且具有較強(qiáng)的搜索能力和收斂性。
任務(wù)調(diào)度;行政管理;遺傳算法;退火算法
目前大部分部門的電子行政管理系統(tǒng)對信息化的交流僅利用基礎(chǔ)平臺的發(fā)布,封閉的系統(tǒng)結(jié)構(gòu)使得信息資源難以高效的共享[1]。行政管理系統(tǒng)的任務(wù)調(diào)度利用數(shù)據(jù)在系統(tǒng)中的業(yè)務(wù)傳輸為電子行政發(fā)展帶來了契機(jī)[2]。由于目前已有的行政系統(tǒng)偏重于工作流程的建模,讓用戶群體容易忽略任務(wù)調(diào)度的重要性[3]。調(diào)度策略的優(yōu)先級關(guān)系到電子行政系統(tǒng)的整體業(yè)務(wù)工作,將有限的信息資源進(jìn)行整合與挖掘?qū)μ岣吖ぷ髁鞒绦势鸬街陵P(guān)作用[4]。本研究在簡要分析行政管理系統(tǒng)環(huán)境的基礎(chǔ)上,將數(shù)據(jù)資源與任務(wù)相結(jié)合、遺傳算法與退火算法相結(jié)合,提出了一種面向行政管理系統(tǒng)的任務(wù)調(diào)度算法。該算法依據(jù)任務(wù)調(diào)度數(shù)據(jù)特點(diǎn)進(jìn)行整數(shù)編碼完成動態(tài)規(guī)劃模型,通過遺傳算法的適應(yīng)度函數(shù)對任務(wù)數(shù)據(jù)進(jìn)行全局最優(yōu)解搜索,并結(jié)合退火算法調(diào)整適應(yīng)函數(shù)以降低時間復(fù)雜度。
1.1 行政管理云任務(wù)
在行政管理系統(tǒng)的環(huán)境下進(jìn)行任務(wù)的調(diào)度,其任務(wù)的實(shí)質(zhì)就是將相互之間存在關(guān)聯(lián)的Z個任務(wù)在R個資源上進(jìn)行平行高效的處理與執(zhí)行[5],在任務(wù)調(diào)用的同時還需要滿足占用帶寬、數(shù)據(jù)可靠性、實(shí)際投入經(jīng)費(fèi)、任務(wù)調(diào)度所分配時間的約束[6]。在行政管理系統(tǒng)中進(jìn)行任務(wù)調(diào)度可具體描述如下:當(dāng)可用資源數(shù)量為R時,其所對應(yīng)的集合為Q={q1,q2,…,qr};在進(jìn)行任務(wù)調(diào)度的過程中,系統(tǒng)操作者提交任務(wù)的數(shù)量為G,其所對應(yīng)的集合為N={N1,N2,…,Ng};同時將G個任務(wù)劃分為Z個分區(qū)任務(wù),其所對應(yīng)的集合為Y={Y1,Y2,…,Yz},換而言之即第Ng個任務(wù)將會被配分為Ynum(Ng)個任務(wù),則G個任務(wù)經(jīng)過劃分之后所對應(yīng)的任務(wù)總數(shù)為:
1.2 算法操作
本研究在行政管理體系的任務(wù)調(diào)度過程中引入了模擬退火算法以及遺傳算法,通過將兩者的結(jié)合,使得模擬退火算法的優(yōu)點(diǎn)充分的發(fā)揮出來,同時將推進(jìn)任務(wù)調(diào)度的進(jìn)程并且提高整體協(xié)作的效率。所謂的模擬退火算法即在初始溫度較高的條件下,當(dāng)環(huán)境的溫度參數(shù)緩慢下降時,出于概率突跳的特性,算法將在求解的空間內(nèi)隨機(jī)尋求目標(biāo)函數(shù)的最優(yōu)解的過程[7]。而遺傳模擬算法的初始條件產(chǎn)生于一組隨機(jī)的初始解,通過選擇、交叉、變異等一系列的遺傳程序產(chǎn)生新的個體,并針對產(chǎn)生的每個新的個體來模擬退火過程,通過這樣的過程將結(jié)果遺傳給下一代群體中的個體,從而實(shí)現(xiàn)目標(biāo)函數(shù)最優(yōu)解的求解過程[8]。在本文中將模擬退火算法和遺傳算法相結(jié)合,其具體的步驟如下:
步驟1:當(dāng)初始溫度為tk時,對進(jìn)行過選擇、交叉、變異等一系列的遺傳程序的種群個體分別測算其適應(yīng)度值。
步驟2:針對測算出的親代染色體的適應(yīng)度值進(jìn)行比較,同時參照Metropolis準(zhǔn)則對遺傳程序后得到的個體進(jìn)行接受選擇。
步驟 3:設(shè) tk+1=αtk,其中t表示溫度衰減函數(shù),α表示其中的參數(shù),同時還需要對迭代次數(shù)進(jìn)行更新。
步驟4:由于控制參數(shù)的衰減量將會影響到迭代次數(shù)的選取,因此在此步驟需要先確定衰減函數(shù)。
步驟5:為了使得控制參數(shù)的每個取值在行政管理系統(tǒng)中保持相對的穩(wěn)定,設(shè)定的迭代次數(shù)不宜取太小的值。
步驟6:針對當(dāng)期啊種群的每個個體計算其適應(yīng)度值,直至滿足終止條件。
2.1 編碼與解碼
在行政管理系統(tǒng)中進(jìn)行任務(wù)調(diào)度時引入的模擬退火算法以及遺傳算法,通過對種群的規(guī)模選取實(shí)現(xiàn)對遺傳算法收斂性的影響。種群規(guī)模出于太小或是太大的狀態(tài)下都會對整體的算法運(yùn)行性能產(chǎn)生影響。根據(jù)前人研究經(jīng)驗(yàn)[9],本文將種群的規(guī)模設(shè)定在20~175之間。隨機(jī)設(shè)定染色體長度為m,基因在[1,n]的區(qū)間內(nèi)隨機(jī)取值。同時假設(shè)行政管理系統(tǒng)的環(huán)境中存在5個虛擬機(jī),18個任務(wù),即R=5,G=18,賦予每個基因個體一項任務(wù),基因值與賦予的任務(wù)虛擬機(jī)編號相對應(yīng),其通過遺傳程序所產(chǎn)生的染色體為:P0=[1,3,5,1,2,4,2,1,2,5,1,2,4,2,5,1]。為了得到虛擬機(jī)的排列,需要對上述的染色體進(jìn)行解碼,具體排列如下:
通過利用ETC矩陣[10]以及染色體解碼后的序列測算出計算出每個任務(wù)Ng在被調(diào)用時的占用帶寬、數(shù)據(jù)可靠性以及實(shí)際投入經(jīng)費(fèi)、任務(wù)調(diào)度所分配時間等。系統(tǒng)的操作人員對任務(wù)操作時間的需求可具體劃分為完成時間、起始時間、最終完成時間等。本文將選取任務(wù)的總體完成時間作為行政管理系統(tǒng)下任務(wù)調(diào)度的時間需求評判標(biāo)準(zhǔn),每項任務(wù)Ng的總完成時間為:
即直到任務(wù)Ng中的最后一項分項調(diào)用完成時間所需要的總的時間,tETC(i,j)表示在第i個任務(wù)的時間節(jié)點(diǎn)上處理調(diào)用第j個任務(wù)完成所需要的時間??偟娜蝿?wù)完成時間為:
2.2 適應(yīng)度選擇
遺傳算法主要通過以適應(yīng)度函數(shù)為工具對下一代的進(jìn)化選擇來尋求最優(yōu)解從而解決問題。遺傳算法調(diào)用任務(wù)的收斂速度以及求得的最優(yōu)質(zhì)量如何將與適應(yīng)度函數(shù)的選擇息息相關(guān)[11]。調(diào)度任務(wù)還需要滿足系統(tǒng)操作人員對服務(wù)質(zhì)量的多樣化要求,這也導(dǎo)致了過去的遺傳算法適應(yīng)度函數(shù)目標(biāo)單一,因此將不再適合行政管理系統(tǒng)的環(huán)境下的任務(wù)調(diào)度[12]。在行政管理系統(tǒng)的環(huán)境中,系統(tǒng)操作人員用服務(wù)質(zhì)量QoS的評價標(biāo)準(zhǔn)來對服務(wù)的滿意程度進(jìn)行評價[13]。在適應(yīng)度函數(shù)指標(biāo)選取方面,文中選取帶寬、數(shù)據(jù)可靠性、實(shí)際投入費(fèi)用、任務(wù)總完成時間等不同的目標(biāo)來衡量滿意程度,行政管理系統(tǒng)任務(wù)調(diào)度的適應(yīng)度函數(shù)表述如下:
其中,wi(i=1,2,3,4)表示由不同指標(biāo)構(gòu)成的需求偏好函數(shù)的權(quán)重函數(shù),其主要用來對行政管理系統(tǒng)的操作人員對行政管理系統(tǒng)操作的滿意程度。WTime表示任務(wù)的總體完成時間的用戶滿意度函數(shù),WBW表示任務(wù)調(diào)用過程的實(shí)際投入費(fèi)用用戶滿意度函數(shù),WCost表示任務(wù)調(diào)用的占用帶寬用戶滿意度函數(shù),WSucc表示數(shù)據(jù)的可靠性的用戶滿意度函數(shù)。Ag表示任務(wù)Ng的實(shí)際資源消耗量,Eg表示系統(tǒng)操作人員預(yù)期資源消耗量,因此任務(wù)Ng的操作人員滿意度函數(shù)表述為:
一般情況下當(dāng)實(shí)際資源消耗同系統(tǒng)操作人員的資源消耗量預(yù)期差距越小時,系統(tǒng)操作人員的滿意度則越高,即適應(yīng)度函數(shù)的值趨向于0。實(shí)際資源消耗量大于系統(tǒng)操作人員的資源消耗預(yù)期,則Wi>0,實(shí)際資源消耗量大于系統(tǒng)操作人員的資源消耗預(yù)期,則Wi<0[14]。利用texpt表示的系統(tǒng)操作人員預(yù)期的任務(wù)Ng完成時間,Bwm表示行政管理系統(tǒng)環(huán)境下的資源帶寬,Buser表示系統(tǒng)操作人員指定項目Ng的預(yù)期帶寬,Bi表示任務(wù)Ng所劃分的任務(wù)Yg的帶寬。任務(wù)調(diào)用后的數(shù)據(jù)可靠性選取任務(wù)的完成率表示[15]。假設(shè)行政管理系統(tǒng)環(huán)境下的資源出現(xiàn)故障的概率為P,而系統(tǒng)操作人員的任務(wù)完成率為Psucc。則任務(wù)Ng的總完成時間系統(tǒng)操作人員滿意度函數(shù)、任務(wù)調(diào)用占用帶寬和任務(wù)可靠性的系統(tǒng)操作人員滿意度函數(shù)如下:
實(shí)際投入的費(fèi)用是服務(wù)質(zhì)量QoS最流行的約束之一,在行政管理系統(tǒng)環(huán)境下系統(tǒng)操作人員根據(jù)去要的服務(wù)進(jìn)行付費(fèi)。對于任務(wù)Ti的總費(fèi)用,利用Cuser表明系統(tǒng)操作人員的費(fèi)用預(yù)期,實(shí)際投入費(fèi)用的操作人員滿意度函數(shù)Wcost可根據(jù)自然界優(yōu)勝劣汰的法則從新的個體中選擇適應(yīng)度最高的進(jìn)行遺傳操作,對于適應(yīng)度為fi的種群中的染色體個體進(jìn)行選擇概率Qi計算,具體的表達(dá)式如下:
其中,Pg(g=1,2,3,4)為各項資源的數(shù)量,Ccpu表示CPU的價格、Cmem表示內(nèi)存的價格、Cstor表示存儲器的價格、CBW表示帶寬資源的價格。
2.3 交叉與變異
遺傳算法中的交叉操作實(shí)際上是在模仿自然界的基因繁殖重組的過程,這樣的編碼交叉重組過程與染色體的交叉重組類似,在這樣的過程中容易產(chǎn)生優(yōu)良基因的染色體。在這樣繁衍的過程中對兩個子代個體的約束進(jìn)行檢驗(yàn),當(dāng)這樣的約束條件無法滿足時將其舍棄,而對兩個親代個體進(jìn)行重新的交叉操作,這樣的過程持續(xù)到交叉產(chǎn)生出兩個子代個體滿足約束條件為止。變異和交叉的自適應(yīng)調(diào)整概率函數(shù)公式如下:
在上式的表達(dá)中,fmax表示種群中的適應(yīng)度的最大值,favg表示種群的平均適應(yīng)度,f*表示交叉?zhèn)€體中適應(yīng)度較大的值,f表示未變異個體的適應(yīng)度的值,Pc1,Pc2,Pm1和 Pm2表示非 0的自然數(shù)。 按照順序交叉法的進(jìn)行遺傳交叉操作,假設(shè)兩個父代個 體 :P1=[2,3,3,4,2,3,4,3,4,2,1,1,3,2,1,4]和P2=[1,2,3,4,3,2,3,4,2,4,2,1,3,4,1,2]。
假設(shè)通過隨機(jī)投點(diǎn)的方式投到第3個基因,則P1基因串為 tP1=[4,2,1,1],P2的基因串為 tP2= [2,3,1,4]。通過在P1中依據(jù)順序查找tP2中的各基因值并向前移位取得新個體,nP1= [2,3,1,4,2,1,1,4,2,3,4,1,2,3,4,1]。同理,通過在P2中依據(jù)順序查找tP1中的各基因值并向前移位取得新個體,nP2=[4,2,1,1,2,3,1,4,2,3,1,4,1,1,3]。
遺傳算法中的變異操作是按照編碼的概率類似于基因突變的概率擾動變化的,一般采用隨機(jī)取點(diǎn)的方法[16],其整數(shù)取值范圍為[1,m]。假設(shè)選取父代個體P1變異操作,當(dāng)隨機(jī)投點(diǎn)至第6個基因時,選定的基因值為3,在[1,4]范圍內(nèi)隨機(jī)取不等于3的數(shù),假設(shè)隨機(jī)數(shù)取值為2,則對P1進(jìn)行變異后得新個體nP1=[1,2,3,1,2,3,2,1,2,3,1,3,1,2,4,1]。
實(shí)驗(yàn)所選取的模擬仿真平臺為Matlab,同時以Ant軟件為工具對CloudSim進(jìn)行了重新的編譯,此外在擴(kuò)展的平臺上將改進(jìn)的模擬退火算法與遺傳算法進(jìn)行比較。最先對傳統(tǒng)遺傳算法和遺傳模擬退火算法的系統(tǒng)操作人員的滿意度程度進(jìn)行比較。本文的實(shí)驗(yàn)參數(shù)如表1所示。
表1 參數(shù)設(shè)置
針對本研究中的行政管理系統(tǒng)的任務(wù)調(diào)度算法問題,目標(biāo)函數(shù)考慮虛擬機(jī)在109指令/秒,對于任務(wù)調(diào)度分配時間、實(shí)際投入經(jīng)費(fèi)、占用帶寬和任務(wù)長度分別為70 s、40 000、100 Mb和1010指令。為了研究不同的加權(quán)值對任務(wù)調(diào)度結(jié)果滿意度的影響。因此,通過對不同的目標(biāo)加權(quán)值變化設(shè)定5組實(shí)驗(yàn),其中1~4組實(shí)驗(yàn)分別研究一個加權(quán)值對任務(wù)調(diào)度結(jié)果滿意度的影響,第5組實(shí)驗(yàn)作為對比項。具體的權(quán)值設(shè)置如表2所示。
表2 實(shí)驗(yàn)權(quán)值設(shè)置
每組實(shí)驗(yàn)進(jìn)行10次,每次實(shí)驗(yàn)?zāi)M對70 s內(nèi)的任務(wù)調(diào)度指令進(jìn)行分配,根據(jù)調(diào)度結(jié)果計算平均每個任務(wù)調(diào)度需要分配的用戶滿意度。本研究提出的針對行政管理系統(tǒng)的任務(wù)調(diào)度算法利用遺傳算法與退貨算法相結(jié)合的方式,適應(yīng)度反映用戶對任務(wù)調(diào)度結(jié)果的滿意程度。當(dāng)適應(yīng)度等于、大于和小于0時,分別代表著任務(wù)調(diào)度結(jié)果與工作人員的期望值相同、偏高和偏低。對于任務(wù)調(diào)度結(jié)果要高于或等于工作人員期望值才可以滿意日常行政管理系統(tǒng)的正常運(yùn)行。因此,將本研究提出的遺傳退火混合算法與傳統(tǒng)遺傳算法的適應(yīng)度進(jìn)行對比,即對比行政管理系統(tǒng)工作人員的期望值。結(jié)果如圖1所示。
圖1 滿意度對比
由圖1可見,本研究提出的遺傳退火算法的適應(yīng)度高于傳統(tǒng)的遺傳算法,即可以更好的為行政管理系統(tǒng)的用戶服務(wù),遺傳退火算法滿意度平均值比傳統(tǒng)遺傳算法高8%。為了考查任務(wù)調(diào)度算法在計算上的效率和實(shí)際應(yīng)用的效果,繼續(xù)考查針?biāo)惴ǖ娜蝿?wù)調(diào)度分配時間和實(shí)際投入經(jīng)費(fèi)與任務(wù)數(shù)量的關(guān)系。結(jié)果如圖2所示。
圖2 時間與花費(fèi)對比
由圖2(a)實(shí)驗(yàn)結(jié)果表明,遺傳退火算法在任務(wù)調(diào)度執(zhí)行總完成時間上相比傳統(tǒng)遺傳算法具有明顯優(yōu)勢,隨著任務(wù)個數(shù)的增加調(diào)度時間差距愈明顯;在圖2(b)中,在任務(wù)花費(fèi)的比較上,遺傳退火算法隨著任務(wù)數(shù)量的增多優(yōu)勢越明顯,整體平均實(shí)際投入經(jīng)費(fèi)比傳統(tǒng)遺傳算法少3 863。在處理60個任務(wù)調(diào)度時,遺傳退火算法完成時間比傳統(tǒng)遺傳算法少410 ms,實(shí)際投入經(jīng)費(fèi)少2 888。
本研究針對行政管理系統(tǒng)的任務(wù)調(diào)度特點(diǎn),利用遺傳算法與退火算法相結(jié)合的方式提出了一種面向電子行政管理系統(tǒng)任務(wù)調(diào)度的混合算法策略。該算法策略將遺傳算法的適應(yīng)度函數(shù)應(yīng)用到電子行政管理系統(tǒng)工作人員對任務(wù)調(diào)度的滿意度中,并且通過退火算法調(diào)整適應(yīng)度函數(shù)加快了算法的最優(yōu)解搜索能力。該混合算法能夠反映任務(wù)調(diào)度與執(zhí)行時間、任務(wù)花費(fèi)的關(guān)系,可以更加全面的評估行政管理系統(tǒng)。通過仿真模擬結(jié)果表明,本研究提出的任務(wù)調(diào)度算法滿意度高于傳統(tǒng)遺傳算法,即更符合實(shí)際電子行政管理系統(tǒng)的使用,并且任務(wù)調(diào)度分配時間和實(shí)際投入經(jīng)費(fèi)明顯低于傳統(tǒng)遺傳算法。該算法為行政管理系統(tǒng)下任務(wù)調(diào)度問題提供了更加便利的解決方案。
[1]藺豆豆,張銳昕.電子行政審批系統(tǒng)的多元需求及其滿足——以吉林省氣象局為例[J].電子政務(wù),2014(9):77-83.
[2]曹潔,曾國蓀,鈕俊,等.云環(huán)境下可用性感知的并行任務(wù)調(diào)度方法[J].計算機(jī)研究與發(fā)展,2013,50(7):1563-1572.
[3]陳英武,邢立寧,王暉,等.網(wǎng)絡(luò)環(huán)境下社會管理的組織行為建模與計算實(shí)驗(yàn)研究綜述[J].自動化學(xué)報,2015,41(3):462-474.
[4]賈林.一體化視頻會議管理系統(tǒng)應(yīng)用研究[J].現(xiàn)代電子技術(shù),2015(1):122-124
[5]劉少偉,孔令梅,任開軍,等.云環(huán)境下優(yōu)化科學(xué)工作流執(zhí)行性能的兩階段數(shù)據(jù)放置與任務(wù)調(diào)度策略[J].計算機(jī)學(xué)報,2011,34(11):2121-2130.
[6]李文娟,張啟飛,平玲娣,等.基于模糊聚類的云任務(wù)調(diào)度算法[J].通信學(xué)報,2012(3):146-154.
[7]傅文淵,凌朝東.布朗運(yùn)動模擬退火算法[J].計算機(jī)學(xué)報,2014,37(6):1301-1308.
[8]馬永杰,云文霞.遺傳算法研究進(jìn)展[J].計算機(jī)應(yīng)用研究,2012,29(4):1201-1206.
[9]李強(qiáng),郝沁汾,肖利民,等.云計算中虛擬機(jī)放置的自適應(yīng)管理與多目標(biāo)優(yōu)化 [J].計算機(jī)學(xué)報,2011,34(12):2253-2264.
[10]鄒偉明,于炯.云計算環(huán)境下基于用戶滿意度的遺傳算法[J].計算機(jī)應(yīng)用研究,2014,31(1):85-88.
[11]楊水清,楊加明,孫超.改進(jìn)的乘冪適應(yīng)度函數(shù)在遺傳算法中的應(yīng)用 [J].計算機(jī)工程與應(yīng)用,2014,50(17):40-43.
[12]李建鋒,彭艦.云計算環(huán)境下基于改進(jìn)遺傳算法的任務(wù)調(diào)度算法[J].計算機(jī)應(yīng)用,2011,31(1):184-186.
[13]祝家鈺,肖丹,王飛.云計算下負(fù)載均衡的多維QoS約束任務(wù)調(diào)度機(jī)制[J].計算機(jī)工程與應(yīng)用,2013,49(9):85-89.
[14]徐達(dá)宇,楊善林,羅賀.云計算環(huán)境下多源信息資源管理方法[J].計算機(jī)集成制造系統(tǒng),2012,18(9): 2028-2039.
[15]趙新超,吳召軍.求解背包問題的多位極貪婪遺傳算法[J].廣西師范大學(xué)學(xué)報:自然科學(xué)版,2013,31(4):41-47.
[16]弭寶福,徐梅,王福林,等.交叉概率對遺傳算法運(yùn)算速度影響的測試與分析[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2013,43(22):215-218.
Research on task scheduling algorithm for system of administration
TANG Yue-xia
(Shanghai Fengxian District Centeral Hospital,Ministry of Information Management Sum Statistics,Shanghai 201499,China)
To better address the cloud computing system administration task scheduling problem of large interactive data,this study based on the advantages of integrated genetic algorithms and annealing algorithm presents a genetic annealing hybrid algorithm.The algorithm for the administrative task scheduling system characteristic data relationships in a cloud computing environment to perform tasks integer coding genetic algorithm fitness function of task data to search the global optimal solution,coding task data crossover recombination process,using annealing algorithm to adjust the adaptive function of the ways to speed up the system on a virtual machine task scheduling is complete. Experiments show that the task scheduling algorithm fitness value is higher than the traditional genetic algorithm and has a strong search ability and convergence.
task scheduling;administration;GA;annealing algorithm
TN876.2
:A
:1674-6236(2017)06-0009-05
2016-08-19稿件編號:201608146
唐月霞(1982—),女,上海人,助理工程師。研究方向:信息管理。