鮑寧海 李國(guó)平 冉 琴 岳渤涵
(重慶郵電大學(xué)通信與信息工程學(xué)院 重慶 400065)
近年來,網(wǎng)絡(luò)虛擬化技術(shù)的不斷發(fā)展和應(yīng)用打破了傳統(tǒng)互聯(lián)網(wǎng)的僵化結(jié)構(gòu),為各類新興業(yè)務(wù)的迅速推廣提供了極大的便利。通過對(duì)計(jì)算、存儲(chǔ)和帶寬資源的抽象、匯聚與分配,底層的物理網(wǎng)絡(luò)資源可以在不同的互聯(lián)網(wǎng)業(yè)務(wù)提供商之間靈活共享,從而使眾多基于虛擬網(wǎng)的應(yīng)用得以廣泛部署[1]。
虛擬網(wǎng)(Virtual Network,VN)通常是一定數(shù)量的虛擬節(jié)點(diǎn)和虛擬鏈路的集合。其中,每個(gè)虛擬節(jié)點(diǎn)以虛擬機(jī)的形式映射于一個(gè)物理節(jié)點(diǎn)中,實(shí)現(xiàn)計(jì)算和存儲(chǔ)資源的匯聚,而每條虛擬鏈路映射于兩個(gè)虛擬節(jié)點(diǎn)間的物理通路上,提供虛擬機(jī)之間的連通[2]。由于虛擬網(wǎng)各組件間的密切關(guān)聯(lián)性,任何虛擬節(jié)點(diǎn)或虛擬鏈路的損毀都可能造成大量的業(yè)務(wù)中斷和數(shù)據(jù)丟失,因此,虛擬網(wǎng)的生存性將成為影響未來網(wǎng)絡(luò)運(yùn)行和業(yè)務(wù)發(fā)展的重要問題。
本文針對(duì)大規(guī)模災(zāi)難事件(如地震、海嘯等)對(duì)多個(gè)物理網(wǎng)絡(luò)節(jié)點(diǎn)及相關(guān)鏈路造成的嚴(yán)重威脅,重點(diǎn)研究同一虛擬網(wǎng)中多個(gè)風(fēng)險(xiǎn)虛擬機(jī)的快速協(xié)同撤離機(jī)制,以減少單個(gè)虛擬網(wǎng)的撤離完成時(shí)長(zhǎng)和損毀風(fēng)險(xiǎn)。
虛擬網(wǎng)生存性策略可分為網(wǎng)絡(luò)組件抗毀和在線業(yè)務(wù)抗毀兩類。前者可以采用虛擬網(wǎng)備份映射或重構(gòu)來實(shí)現(xiàn)[3,4],后者主要通過虛擬機(jī)在線遷移來完成[5]。而虛擬機(jī)的在線遷移技術(shù)又主要分為預(yù)復(fù)制遷移和后復(fù)制遷移兩類,可廣泛應(yīng)用于在線系統(tǒng)維護(hù)、負(fù)載均衡、資源優(yōu)化、能耗管理等領(lǐng)域[6]。
預(yù)復(fù)制遷移是先將原虛擬機(jī)的磁盤數(shù)據(jù)和主要內(nèi)存頁(yè)復(fù)制到目的虛擬機(jī),再以迭代方式將原虛擬機(jī)產(chǎn)生的內(nèi)存臟頁(yè)(發(fā)生變化的內(nèi)存信息)傳遞到目的虛擬機(jī)直到剩余臟頁(yè)量或迭代次數(shù)滿足要求,最后通過宕機(jī)切換將原虛擬機(jī)CPU狀態(tài)和剩余臟頁(yè)復(fù)制到目的虛擬機(jī)并啟動(dòng)目的虛擬機(jī)。后復(fù)制遷移則是首先通過宕機(jī)切換將原虛擬機(jī)CPU狀態(tài)和少量必要內(nèi)存頁(yè)復(fù)制到目的虛擬機(jī)并啟動(dòng)目的虛擬機(jī),然后再將剩余的內(nèi)存頁(yè)和磁盤數(shù)據(jù)主動(dòng)復(fù)制并推送至目的虛擬機(jī)。
在虛擬機(jī)遷移技術(shù)的研究中,宕機(jī)時(shí)長(zhǎng)和總遷移時(shí)長(zhǎng)通常被用作衡量虛擬機(jī)在線遷移性能和效率的重要參考指標(biāo)[7]。為減小虛擬機(jī)的預(yù)復(fù)制遷移時(shí)長(zhǎng),文獻(xiàn)[8]通過預(yù)測(cè)迭代周期內(nèi)的臟頁(yè)數(shù)量,對(duì)遷移帶寬進(jìn)行動(dòng)態(tài)預(yù)留和調(diào)整。文獻(xiàn)[9]根據(jù)內(nèi)存臟碼率對(duì)遷移帶寬和預(yù)復(fù)制迭代次數(shù)進(jìn)行優(yōu)化,提高網(wǎng)絡(luò)帶寬利用率,減小總遷移時(shí)長(zhǎng)。文獻(xiàn)[10]通過虛擬機(jī)遷移次序和遷移帶寬的調(diào)度與優(yōu)化,最小化預(yù)復(fù)制遷移時(shí)長(zhǎng)。文獻(xiàn)[11]采用速率感知的帶寬共享傳輸滿足預(yù)復(fù)制遷移的宕機(jī)時(shí)長(zhǎng)和總遷移時(shí)長(zhǎng)約束。文獻(xiàn)[12]提出一種增強(qiáng)型距離自適應(yīng)預(yù)復(fù)制遷移帶寬分配算法,以降低遷移阻塞率。
為有效降低在線遷移過程中的傳輸負(fù)載,文獻(xiàn)[13]針對(duì)后復(fù)制遷移,利用遠(yuǎn)程失效頁(yè)面過濾技術(shù)提高遷移內(nèi)容的有效性。文獻(xiàn)[14]提出一種分散集中式后復(fù)制遷移策略,利用多個(gè)中間節(jié)點(diǎn)作為緩存代理,解決目標(biāo)主機(jī)接收速率過慢的問題。文獻(xiàn)[15]提出一種反向增量檢查機(jī)制,保障后復(fù)制遷移中斷后虛擬機(jī)的快速恢復(fù),避免宕機(jī)時(shí)長(zhǎng)和總遷移時(shí)長(zhǎng)的惡化。
針對(duì)關(guān)聯(lián)性多虛擬機(jī)遷移問題,文獻(xiàn)[16]通過并行預(yù)復(fù)制遷移策略優(yōu)化遷移帶寬分配,獲得低于串行預(yù)復(fù)制遷移的平均宕機(jī)時(shí)長(zhǎng)、總遷移時(shí)長(zhǎng),以及遷移阻塞率。文獻(xiàn)[17]根據(jù)關(guān)聯(lián)虛擬機(jī)業(yè)務(wù)流量的相關(guān)性確定遷移次序,減小預(yù)復(fù)制遷移的平均宕機(jī)時(shí)長(zhǎng)。文獻(xiàn)[18]通過多虛擬機(jī)遷移帶寬和預(yù)復(fù)制迭代次數(shù)的聯(lián)合優(yōu)化,對(duì)虛擬機(jī)宕機(jī)時(shí)長(zhǎng)和總遷移時(shí)長(zhǎng)進(jìn)行平衡和折中。
顯然,在現(xiàn)有研究工作中,預(yù)復(fù)制遷移技術(shù)受到了更多的關(guān)注[8–12,16–18]。在預(yù)復(fù)制遷移過程中,由于原虛擬機(jī)始終保有CPU狀態(tài),可在遷移中斷時(shí)迅速恢復(fù),能為在線遷移提供更高的可靠性。然而,原虛擬機(jī)產(chǎn)生的大量臟頁(yè)將不可避免地增加遷移負(fù)載,因此,基于預(yù)復(fù)制遷移的研究工作大多集中在臟頁(yè)迭代周期規(guī)劃和網(wǎng)絡(luò)帶寬資源優(yōu)化上,以便在宕機(jī)時(shí)長(zhǎng)與總遷移時(shí)長(zhǎng)上獲得較好的折中[8–12]。而后復(fù)制遷移技術(shù)由于避免了大量臟頁(yè)的產(chǎn)生和傳遞,遷移負(fù)載顯著減小,從而獲得更短的總遷移時(shí)長(zhǎng),因此,基于后復(fù)制遷移的研究工作主要集中在對(duì)內(nèi)存頁(yè)的壓縮、標(biāo)識(shí),以及網(wǎng)絡(luò)資源的有效利用上,以進(jìn)一步提高在線遷移的效率或可靠性[13–15]。
從以上分析可以看出,相對(duì)于預(yù)復(fù)制遷移,后復(fù)制遷移更適合虛擬機(jī)的快速緊急遷移。然而,在大規(guī)模災(zāi)難風(fēng)險(xiǎn)下,虛擬網(wǎng)快速撤離的關(guān)鍵不是單個(gè)虛擬機(jī)的遷移完成時(shí)間,而是該虛擬網(wǎng)中所有風(fēng)險(xiǎn)虛擬機(jī)最終完成遷移的時(shí)間?,F(xiàn)有關(guān)于多虛擬機(jī)遷移的研究大多采用預(yù)復(fù)制遷移技術(shù),主要目標(biāo)還是通過迭代調(diào)度和資源優(yōu)化解決宕機(jī)時(shí)長(zhǎng)和總遷移時(shí)長(zhǎng)的平衡問題[16–18],并未就大規(guī)模災(zāi)難風(fēng)險(xiǎn)場(chǎng)景下的虛擬網(wǎng)生存性問題進(jìn)行針對(duì)性研究。因此,本文基于后復(fù)制遷移技術(shù),提出一種應(yīng)對(duì)災(zāi)難風(fēng)險(xiǎn)的多虛擬機(jī)快速協(xié)同撤離機(jī)制。
大規(guī)模災(zāi)難事件可能對(duì)通信網(wǎng)基礎(chǔ)設(shè)施造成嚴(yán)重的破壞,并對(duì)映射于災(zāi)難風(fēng)險(xiǎn)區(qū)內(nèi)的大量虛擬機(jī)及其相關(guān)業(yè)務(wù)構(gòu)成極大的威脅。如何快速撤離這些風(fēng)險(xiǎn)虛擬機(jī)已成為虛擬網(wǎng)抗毀的一個(gè)重要問題。特別是,當(dāng)虛擬網(wǎng)的多個(gè)甚至全部虛擬機(jī)均處于災(zāi)難風(fēng)險(xiǎn)區(qū)時(shí),虛擬網(wǎng)的生存性將取決于所有風(fēng)險(xiǎn)虛擬機(jī)是否能夠?qū)崿F(xiàn)快速協(xié)同撤離,而目前對(duì)該問題的研究尚待深入。
針對(duì)以上情況,本文假設(shè)一次大規(guī)模災(zāi)難事件導(dǎo)致多個(gè)具有地理關(guān)聯(lián)性的物理網(wǎng)絡(luò)節(jié)點(diǎn)(及其鄰接鏈路)陷入災(zāi)難風(fēng)險(xiǎn)區(qū)。當(dāng)任何一個(gè)虛擬網(wǎng)有一個(gè)或多個(gè)虛擬機(jī)映射于風(fēng)險(xiǎn)物理節(jié)點(diǎn)上時(shí),需要對(duì)該虛擬網(wǎng)進(jìn)行快速撤離。虛擬網(wǎng)撤離問題主要包括虛擬網(wǎng)重構(gòu)和虛擬機(jī)在線遷移兩個(gè)子問題,二者均屬于NP-hard問題[2,6]。由于大量虛擬網(wǎng)業(yè)務(wù)的運(yùn)行依賴于各虛擬機(jī)的協(xié)同工作,虛擬網(wǎng)及其業(yè)務(wù)的生存性將取決于最后一個(gè)風(fēng)險(xiǎn)虛擬機(jī)的遷移結(jié)束時(shí)間。因此,本文以減少單個(gè)虛擬網(wǎng)的撤離完成時(shí)長(zhǎng),降低損毀風(fēng)險(xiǎn)為目標(biāo),重點(diǎn)研究同一虛擬網(wǎng)中多個(gè)風(fēng)險(xiǎn)虛擬機(jī)的快速協(xié)同撤離機(jī)制。
為應(yīng)對(duì)大規(guī)模災(zāi)難風(fēng)險(xiǎn)對(duì)虛擬網(wǎng)及其業(yè)務(wù)造成的嚴(yán)重威脅,本文提出一種多虛擬機(jī)快速協(xié)同撤離(Multi-virtual-machine Rapid Cooperative Evacuation,MRCE)機(jī)制。該機(jī)制將虛擬網(wǎng)的撤離過程分為兩個(gè)階段,即首先在風(fēng)險(xiǎn)區(qū)外對(duì)虛擬網(wǎng)進(jìn)行重構(gòu),實(shí)現(xiàn)虛擬網(wǎng)的組件抗毀,再通過多虛擬機(jī)協(xié)同遷移,實(shí)現(xiàn)虛擬網(wǎng)的業(yè)務(wù)抗毀。
在廣域網(wǎng)中,節(jié)點(diǎn)資源相對(duì)于帶寬資源更易于升級(jí)與擴(kuò)容,因此,假設(shè)每個(gè)物理節(jié)點(diǎn)中的計(jì)算資源和存儲(chǔ)資源都是足夠的。為在重構(gòu)虛擬鏈路長(zhǎng)度與虛擬機(jī)遷移通路長(zhǎng)度上取得平衡,實(shí)現(xiàn)網(wǎng)絡(luò)帶寬資源的優(yōu)化利用,首先建立物理節(jié)點(diǎn)代價(jià)函數(shù),如式(5)所示。其中,表 示虛擬節(jié)點(diǎn)nv到物理節(jié)點(diǎn)ns的 最短距離(跳數(shù)),表示虛擬網(wǎng)Gv中所有虛擬節(jié)點(diǎn)到中物理節(jié)點(diǎn)ns的最短距離和。
通過式(5),在風(fēng)險(xiǎn)區(qū)域外尋找代價(jià)最小的物理節(jié)點(diǎn)作為錨點(diǎn),并將距離錨點(diǎn)H(≤2)跳內(nèi)的區(qū)域劃為的節(jié)點(diǎn)重構(gòu)區(qū)域。然后,在重構(gòu)區(qū)域內(nèi)根據(jù)最大資源優(yōu)先原則均衡分配節(jié)點(diǎn)資源,即優(yōu)先將具有最大節(jié)點(diǎn)資源需求的虛擬節(jié)點(diǎn)映射到具有最大可用節(jié)點(diǎn)資源的物理節(jié)點(diǎn)上。最后,利用最短路算法在風(fēng)險(xiǎn)區(qū)域外重構(gòu)中的虛擬鏈路。
在網(wǎng)絡(luò)帶寬資源有限的情況下,虛擬機(jī)的遷移數(shù)據(jù)量是影響遷移完成時(shí)間的重要因素,因此,本文采用后復(fù)制遷移技術(shù),避免大量臟頁(yè)的產(chǎn)生和迭代傳輸,并假設(shè)遷移數(shù)據(jù)均為總量確定的必要數(shù)據(jù),不涉及數(shù)據(jù)清理、過濾及壓縮等問題。
本文中多虛擬機(jī)協(xié)同遷移的主要目標(biāo)是減小單個(gè)虛擬網(wǎng)的撤離完成時(shí)長(zhǎng)。在為風(fēng)險(xiǎn)虛擬機(jī)建立遷移通路時(shí),過小的遷移帶寬將導(dǎo)致該虛擬機(jī)的遷移完成時(shí)長(zhǎng)超長(zhǎng),從而影響整個(gè)虛擬網(wǎng)的撤離完成時(shí)長(zhǎng)。為解決這一問題,首先引入虛擬機(jī)基礎(chǔ)遷移帶寬約束條件,如式(6)所示。其中,Tmax表示虛擬機(jī)的最大遷移完成時(shí)長(zhǎng)門限,τmax表示虛擬機(jī)的最大宕機(jī)時(shí)長(zhǎng),Di表 示風(fēng)險(xiǎn)虛擬機(jī)mi的待遷移數(shù)據(jù)量,Bi表 示mi的遷移帶寬。
由于虛擬網(wǎng)的撤離完成時(shí)長(zhǎng)取決于最后一個(gè)風(fēng)險(xiǎn)虛擬機(jī)的遷移結(jié)束時(shí)間,當(dāng)式(6)中的Bi取最小值時(shí),該虛擬網(wǎng)中各風(fēng)險(xiǎn)虛擬機(jī)的遷移完成時(shí)長(zhǎng)相同,且均為Tmax。然而,在動(dòng)態(tài)變化的網(wǎng)絡(luò)資源環(huán)境下,如果固定采用m in(Bi)作為遷移帶寬,嚴(yán)格執(zhí)行多虛擬機(jī)的同步遷移,可能會(huì)犧牲網(wǎng)絡(luò)帶寬的資源利用率。因此,通過選擇合適的基礎(chǔ)遷移帶寬,并根據(jù)網(wǎng)絡(luò)資源狀態(tài)對(duì)其進(jìn)行調(diào)整和升級(jí),提高風(fēng)險(xiǎn)虛擬網(wǎng)的撤離效率。為解決可能出現(xiàn)的遷移帶寬升級(jí)受限的問題,采用多通路策略提高帶寬升級(jí)的靈活性。同時(shí),為使同一虛擬網(wǎng)中各風(fēng)險(xiǎn)虛擬機(jī)的遷移完成時(shí)長(zhǎng)盡可能一致,還需對(duì)各虛擬機(jī)的遷移帶寬進(jìn)行協(xié)同調(diào)整。
根據(jù)以上方案描述,本文設(shè)計(jì)了相應(yīng)的MRCE啟發(fā)式算法,用于實(shí)現(xiàn)大規(guī)模災(zāi)難風(fēng)險(xiǎn)下虛擬網(wǎng)的快速撤離。其中,子算法-1完成虛擬網(wǎng)重構(gòu),子算法-2完成多虛擬機(jī)協(xié)同遷移的初始配置。
(1)MRCE算法
步驟1 將所有風(fēng)險(xiǎn)虛擬網(wǎng)放入集合R,并按其所含風(fēng)險(xiǎn)虛擬機(jī)數(shù)量升序排列,初始化當(dāng)前時(shí)間tc=0,每個(gè)虛擬機(jī)已遷移數(shù)據(jù)量=0,遷移完成時(shí)間=∞;
步驟2 如果集合R/=?,調(diào)用子算法-1對(duì)R中的每個(gè)風(fēng)險(xiǎn)虛擬網(wǎng)進(jìn)行重構(gòu),調(diào)用子算法-2為重構(gòu)虛擬網(wǎng)中的每個(gè)風(fēng)險(xiǎn)虛擬機(jī)分配遷移通路和帶寬,將遷移帶寬分配成功的虛擬網(wǎng)移入集合E中,跳轉(zhuǎn)到步驟3,否則,跳轉(zhuǎn)到步驟8;
步驟3 如果集合E/=?,對(duì)E中虛擬網(wǎng)的各風(fēng)險(xiǎn)虛擬機(jī) mi執(zhí)行后復(fù)制遷移,跳轉(zhuǎn)到步驟4,否則,跳轉(zhuǎn)到步驟2;
步驟5 如果該mi為所屬虛擬網(wǎng)內(nèi)第1個(gè)完成遷移的虛擬機(jī),根據(jù)式(11)計(jì)算該虛擬網(wǎng)內(nèi)其他mi的遷移完成時(shí)差并放入集合U,跳轉(zhuǎn)到步驟7,否則,跳轉(zhuǎn)到步驟6;
步驟6 如果該 mi為所屬虛擬網(wǎng)內(nèi)最后一個(gè)完成遷移的虛擬機(jī),將該虛擬網(wǎng)從E中刪除,跳轉(zhuǎn)到步驟7,否則,跳轉(zhuǎn)到步驟7;
步驟7 更新U中所有的并刪除=0的記錄,如果U/=?,將降序排列,依次將相應(yīng)的虛擬機(jī)遷移帶寬升級(jí)至上限,跳轉(zhuǎn)到步驟2,否則,跳轉(zhuǎn)到步驟2;
步驟8 算法結(jié)束。
(2)子算法-1
步驟2 依次為中的虛擬節(jié)點(diǎn)按最大節(jié)點(diǎn)資源需求優(yōu)先原則,在節(jié)點(diǎn)重構(gòu)區(qū)域內(nèi)選取具有最大可用資源的物理節(jié)點(diǎn)進(jìn)行重映射;
步驟5 風(fēng)險(xiǎn)虛擬網(wǎng)Gv重構(gòu)失敗,釋放已重構(gòu)的虛擬節(jié)點(diǎn)及虛擬鏈路資源,跳轉(zhuǎn)到步驟6;
步驟6 算法結(jié)束。
(3)子算法-2
步驟1 初始化k=1,分別為中的每個(gè)風(fēng)險(xiǎn)虛擬機(jī) mi計(jì)算一條滿足式(6)約束的最短遷移通路,如果成功,跳轉(zhuǎn)到步驟2,否則,跳轉(zhuǎn)到步驟6;
步驟3 如果集合M/=?,令k=k+1,跳轉(zhuǎn)到步驟4,否則,跳轉(zhuǎn)到步驟6;
步驟4 依次為M中每個(gè)mi計(jì)算一條最短通路作為增量遷移通路,根據(jù)式(9)計(jì)算增量帶寬如果,將該mi從M中刪除,跳轉(zhuǎn)到步驟5,否則,令,跳轉(zhuǎn)到步驟5;
步驟5 如果k <K,跳轉(zhuǎn)到步驟3,否則,跳轉(zhuǎn)到步驟6;
步驟6 算法結(jié)束。
根據(jù)以上算法步驟分析,MRCE的時(shí)間復(fù)雜度為O(|Nv|2·|Ns|·log2|Ns|+|Nv|·K·|Ns|·log2|Ns|),其中,Ns與Nv分別表示物理網(wǎng)Gs和虛擬網(wǎng)Gv的最大節(jié)點(diǎn)數(shù),K表示單個(gè)虛擬機(jī)的最大遷移通路數(shù),|Ns|·log2|Ns|為最短路算法的時(shí)間復(fù)雜度。
本文對(duì)提出的多虛擬機(jī)快速協(xié)同撤離算法(MRCE)進(jìn)行仿真測(cè)試,并采用常規(guī)后復(fù)制遷移算法(Regular Post-Copy Migration,RPCM)和基于自適應(yīng)帶寬升級(jí)的后復(fù)制遷移算法(Adaptive bandwidth Upgraded Post-copy Migration,AUPM)進(jìn)行風(fēng)險(xiǎn)虛擬網(wǎng)撤離的性能對(duì)比。3種算法均采用相同的虛擬網(wǎng)重構(gòu)策略,其中,RPCM為每個(gè)虛擬機(jī)尋找最短遷移通路并分配最大可用遷移帶寬,而AUPM在RPCM的基礎(chǔ)上,根據(jù)網(wǎng)絡(luò)帶寬資源狀態(tài),對(duì)遷移帶寬進(jìn)行盡力而為的動(dòng)態(tài)升級(jí)。
仿真采用的物理網(wǎng)絡(luò)拓?fù)浒?4個(gè)節(jié)點(diǎn)和43條鏈路,如圖1所示。假設(shè)各物理節(jié)點(diǎn)均擁有充足的計(jì)算和存儲(chǔ)資源,各物理鏈路的帶寬資源均為240 Gbps。圖中陰影部分代表3個(gè)獨(dú)立的災(zāi)難風(fēng)險(xiǎn)模型,分別包含(3,4,5),(9,12,13)和(16,17,22)3組物理節(jié)點(diǎn)及其相鄰物理鏈路。
圖1 物理網(wǎng)絡(luò)拓?fù)?/p>
隨機(jī)產(chǎn)生90套初始業(yè)務(wù)模型,每套包含500個(gè)虛擬網(wǎng)絡(luò),且隨機(jī)分布(映射)于上述物理網(wǎng)絡(luò)中。其中,每個(gè)虛擬網(wǎng)絡(luò)隨機(jī)產(chǎn)生3~5個(gè)虛擬節(jié)點(diǎn),任意兩個(gè)虛擬節(jié)點(diǎn)間以0.5的概率建立虛擬鏈路,虛擬鏈路帶寬在0.5~3 Gbps間隨機(jī)產(chǎn)生。采用后復(fù)制遷移技術(shù)對(duì)風(fēng)險(xiǎn)虛擬機(jī)進(jìn)行遷移,每個(gè)虛擬機(jī)的待遷移數(shù)據(jù)量在5~10 GB間隨機(jī)產(chǎn)生,宕機(jī)時(shí)長(zhǎng)在0.5~1.5 s間隨機(jī)產(chǎn)生[9]。
在以上仿真環(huán)境中,分別對(duì)MRCE,RPCM和AUPM進(jìn)行仿真測(cè)試,性能指標(biāo)主要包括風(fēng)險(xiǎn)虛擬網(wǎng)的平均撤離完成時(shí)長(zhǎng)、撤離完成時(shí)長(zhǎng)標(biāo)準(zhǔn)差,以及撤離完成率。最終仿真結(jié)果對(duì)3個(gè)災(zāi)難風(fēng)險(xiǎn)模型和90套隨機(jī)業(yè)務(wù)模型取平均??紤]到我國(guó)的地震監(jiān)測(cè)系統(tǒng)已具備一定程度的預(yù)警能力(十幾秒至幾十秒的預(yù)警時(shí)間),但網(wǎng)絡(luò)組件的損毀時(shí)間仍舊難以確定。因此,以10 s為基數(shù)設(shè)立6個(gè)考察周期,分別在算法執(zhí)行后的10 s,20 s,30 s,40 s,50 s,60 s時(shí)間點(diǎn)對(duì)以上性能指標(biāo)進(jìn)行考察記錄。
在MRCE中,虛擬機(jī)最大遷移完成時(shí)長(zhǎng)門限Tmax的選取對(duì)網(wǎng)絡(luò)帶寬資源利用率有較大的影響。如果Tmax取值過大,則虛擬機(jī)的遷移效率降低,可能造成虛擬網(wǎng)的平均撤離完成時(shí)長(zhǎng)過大;如果Tmax取值過小,則虛擬機(jī)的基礎(chǔ)遷移帶寬需求較大,可能造成過高的遷移帶寬阻塞率。因此,首先考察MRCE在不同Tmax設(shè)置下的平均撤離完成時(shí)長(zhǎng)和遷移帶寬阻塞率,并用T10,T20,T30,T40,T50,T60分別代表Tmax取值為10 s,20 s,30 s,40 s,50 s,60 s時(shí)MRCE的相應(yīng)指標(biāo)。
如圖2和圖3所示,在10~60 s考察周期內(nèi),MRCE的平均撤離完成時(shí)長(zhǎng)隨著Tmax取值的增加不斷變大,而其遷移帶寬阻塞率卻隨著Tmax的增加而降低。顯然,由式(6)可知,增大Tmax的取值等同于放松對(duì)基礎(chǔ)遷移帶寬的約束,使得虛擬機(jī)更容易找到可用的遷移通路。然而,當(dāng)網(wǎng)絡(luò)中的帶寬資源較為緊張,且碎片化較為嚴(yán)重時(shí),過小的基礎(chǔ)遷移帶寬會(huì)使以 min(Ti)為基準(zhǔn)的增量帶寬策略變得低效,從而導(dǎo)致虛擬網(wǎng)的撤離完成時(shí)長(zhǎng)變大。圖3數(shù)據(jù)顯示,在此仿真環(huán)境下,當(dāng)Tmax≥40 s時(shí),遷移帶寬阻塞率較低,且數(shù)值變化明顯趨緩,因此在后續(xù)的仿真測(cè)試中,采用40 s作為MRCE的虛擬機(jī)最大遷移完成時(shí)長(zhǎng)門限。
圖2 T max對(duì)平均撤離完成時(shí)長(zhǎng)的影響
圖3 T max對(duì)遷移帶寬阻塞率的影響
風(fēng)險(xiǎn)虛擬網(wǎng)平均撤離完成時(shí)長(zhǎng)如圖4所示。在10 s的考察時(shí)間點(diǎn),MRCE和AUPM的平均撤離完成時(shí)長(zhǎng)均高于RPCM,其原因包括兩個(gè)方面:其一是在撤離開始的初期,包含風(fēng)險(xiǎn)虛擬機(jī)數(shù)量最少的虛擬網(wǎng)將被優(yōu)先撤離,特別是僅包含單個(gè)風(fēng)險(xiǎn)虛擬機(jī)的虛擬網(wǎng),能以最小代價(jià)盡快脫離風(fēng)險(xiǎn)區(qū)。而對(duì)此類風(fēng)險(xiǎn)虛擬網(wǎng)來說,MRCE的協(xié)同撤離策略和AUPM的自適應(yīng)升級(jí)策略的優(yōu)勢(shì)不夠突出。其二是在每一個(gè)考察時(shí)間點(diǎn),虛擬網(wǎng)的平均撤離完成時(shí)長(zhǎng)只統(tǒng)計(jì)當(dāng)前已完成撤離的虛擬網(wǎng),而RPCM在10 s周期內(nèi)完成撤離的虛擬網(wǎng)數(shù)量遠(yuǎn)小于MRCE和AUPM,且完成撤離的主要是僅包含單一風(fēng)險(xiǎn)虛擬機(jī)的虛擬網(wǎng)。從圖4中可以發(fā)現(xiàn),在20 s及以后的考察時(shí)間點(diǎn),MRCE的平均撤離完成時(shí)長(zhǎng)有稍許增加但非常平穩(wěn),AUPM的平均撤離完成時(shí)長(zhǎng)逐漸增長(zhǎng)但較緩慢,而RPCM的平均撤離完成時(shí)長(zhǎng)增長(zhǎng)較為迅速。顯然,相對(duì)于RPCM,AUPM的自適應(yīng)升級(jí)策略能夠更好地提高網(wǎng)絡(luò)帶寬資源利用率,縮短風(fēng)險(xiǎn)虛擬機(jī)的遷移完成時(shí)長(zhǎng),從而在一定程度上縮短風(fēng)險(xiǎn)虛擬網(wǎng)的撤離完成時(shí)長(zhǎng)。而MRCE的協(xié)同撤離策略通過壓縮同一虛擬網(wǎng)中風(fēng)險(xiǎn)虛擬機(jī)間的遷移完成時(shí)差,能夠進(jìn)一步減小各風(fēng)險(xiǎn)虛擬網(wǎng)的撤離完成時(shí)長(zhǎng)。
圖4 不同考察時(shí)間下的平均撤離完成時(shí)長(zhǎng)
風(fēng)險(xiǎn)虛擬網(wǎng)的撤離完成時(shí)長(zhǎng)標(biāo)準(zhǔn)差如圖5所示。在10 s考察時(shí)間點(diǎn),RPCM的撤離完成時(shí)長(zhǎng)標(biāo)準(zhǔn)差與MRCE的接近且稍低于AUPM。其原因除了前面提到的RPCM在該考察周期內(nèi)完成撤離的虛擬網(wǎng)數(shù)量少且主要包含單一風(fēng)險(xiǎn)虛擬機(jī)以外,另一個(gè)原因是在撤離初期,風(fēng)險(xiǎn)區(qū)外的網(wǎng)絡(luò)資源相對(duì)較充足,帶寬資源碎片化情況不嚴(yán)重,因此,RPCM在此期間完成虛擬網(wǎng)撤離所耗費(fèi)的時(shí)長(zhǎng)較短且差距不大。然而,隨著包含多風(fēng)險(xiǎn)虛擬機(jī)的虛擬網(wǎng)開始大量撤離,以及風(fēng)險(xiǎn)區(qū)外網(wǎng)絡(luò)帶寬資源的減少,RPCM的撤離完成時(shí)長(zhǎng)標(biāo)準(zhǔn)差迅速上升。雖然AUPM可以通過自適應(yīng)帶寬升級(jí)提高帶寬資源利用率,但對(duì)縮短同一虛擬網(wǎng)內(nèi)不同風(fēng)險(xiǎn)虛擬機(jī)的遷移完成時(shí)差并無(wú)確定性的作用,即遷移帶寬升級(jí)的結(jié)果可能使時(shí)差減小,也可能使時(shí)差增大。隨著風(fēng)險(xiǎn)區(qū)外可用帶寬資源的逐漸短缺和碎片化,AUPM的自適應(yīng)帶寬升級(jí)效率逐漸降低,這使得不同風(fēng)險(xiǎn)虛擬網(wǎng)撤離完成時(shí)長(zhǎng)的差距逐漸變大。相對(duì)于RPCM和AUPM,MRCE通過基礎(chǔ)遷移帶寬的選取和增量遷移帶寬的配置,以及基于虛擬機(jī)遷移完成時(shí)差的遷移帶寬動(dòng)態(tài)升級(jí),能夠在不同的網(wǎng)絡(luò)帶寬資源狀態(tài)下獲得較為穩(wěn)定的撤離完成時(shí)長(zhǎng)標(biāo)準(zhǔn)差。
圖5 不同考察時(shí)間下的撤離完成時(shí)長(zhǎng)標(biāo)準(zhǔn)差
風(fēng)險(xiǎn)虛擬網(wǎng)的撤離完成率可以直觀反映災(zāi)難風(fēng)險(xiǎn)下虛擬網(wǎng)的抗毀能力。如圖6所示,相對(duì)于AUPM和RPCM,MRCE在各個(gè)階段都能取得更好的撤離完成率。該結(jié)果表明,在災(zāi)難損毀時(shí)間不確定的情況下,MRCE能夠更快更多地完成虛擬網(wǎng)的撤離。值得注意的是,隨著考察時(shí)間的不斷推移,3種算法的撤離完成率也在不斷增長(zhǎng),但增長(zhǎng)率有逐漸變緩的趨勢(shì)。這是因?yàn)殡S著風(fēng)險(xiǎn)區(qū)外的虛擬網(wǎng)(已重構(gòu)且完成撤離)不斷增多,該區(qū)域的帶寬資源消耗也在不斷增加,可用于虛擬機(jī)遷移的帶寬資源大量減少,從而限制了并行撤離的虛擬網(wǎng)數(shù)量。因此,在大量風(fēng)險(xiǎn)虛擬網(wǎng)的撤離過程中,撤離完成率越高,其增長(zhǎng)率下降越明顯。
為應(yīng)對(duì)大規(guī)模災(zāi)難事件對(duì)虛擬網(wǎng)生存性造成的嚴(yán)重威脅,本文研究并提出一種多虛擬機(jī)快速協(xié)同撤離機(jī)制。該機(jī)制采用風(fēng)險(xiǎn)虛擬網(wǎng)的重構(gòu)實(shí)現(xiàn)網(wǎng)絡(luò)組件的抗毀,采用風(fēng)險(xiǎn)虛擬機(jī)的后復(fù)制遷移實(shí)現(xiàn)在線業(yè)務(wù)的抗毀。特別針對(duì)同一虛擬網(wǎng)的多個(gè)或全部虛擬機(jī)均受到災(zāi)難威脅的情況,通過虛擬機(jī)最大遷移完成時(shí)限設(shè)定,約束虛擬網(wǎng)撤離完成時(shí)長(zhǎng),通過虛擬機(jī)遷移完成時(shí)長(zhǎng)預(yù)估和基礎(chǔ)遷移帶寬分配,協(xié)調(diào)各虛擬機(jī)的遷移速度,通過虛擬機(jī)遷移完成時(shí)差評(píng)估和遷移帶寬動(dòng)態(tài)升級(jí),進(jìn)一步壓縮虛擬網(wǎng)撤離完成時(shí)長(zhǎng)。仿真測(cè)試證明,與常規(guī)后復(fù)制遷移算法和基于自適應(yīng)帶寬升級(jí)的后復(fù)制遷移算法相比,多虛擬機(jī)快速協(xié)同撤離算法能夠在不同考察周期內(nèi)獲得較好的虛擬網(wǎng)撤離完成率和平均撤離完成時(shí)長(zhǎng)。本文提出的虛擬網(wǎng)抗毀機(jī)制主要針對(duì)自然災(zāi)難風(fēng)險(xiǎn),在應(yīng)對(duì)未知或不可測(cè)風(fēng)險(xiǎn)(如軍事打擊、意外事件),以及更為嚴(yán)苛的時(shí)間約束等問題上,還有較大的研究空間。