孫 健,張興軍,董小社
(西安交通大學(xué)電子與信息工程學(xué)院,陜西西安 710049)
一種可靠性框圖的異構(gòu)系統(tǒng)可用性評(píng)價(jià)模型
孫 健,張興軍,董小社
(西安交通大學(xué)電子與信息工程學(xué)院,陜西西安 710049)
針對(duì)異構(gòu)系統(tǒng)內(nèi)自治節(jié)點(diǎn)性能特征差異導(dǎo)致系統(tǒng)整體可用性評(píng)價(jià)困難的問(wèn)題,提出一種采用可靠性框圖的可用性評(píng)價(jià)模型.首先,分析系統(tǒng)異構(gòu)性,從節(jié)點(diǎn)和任務(wù)角度對(duì)異構(gòu)性進(jìn)行分類,對(duì)資源異構(gòu)性進(jìn)行數(shù)學(xué)量化;然后,結(jié)合異構(gòu)性分類構(gòu)建串并行混聯(lián)的異構(gòu)系統(tǒng)可靠性框圖可用性評(píng)價(jià)模型,并根據(jù)模型分析節(jié)點(diǎn)和整體異構(gòu)系統(tǒng)的可用性度量方法.可用性評(píng)價(jià)以典型雙節(jié)點(diǎn)和多節(jié)點(diǎn)異構(gòu)系統(tǒng)為例,同時(shí)與馬爾可夫過(guò)程可用性模型的評(píng)價(jià)結(jié)果進(jìn)行比較,結(jié)果表明,文中所提模型能對(duì)異構(gòu)系統(tǒng)可用性進(jìn)行準(zhǔn)確評(píng)價(jià),可為研究異構(gòu)系統(tǒng)可用性提升及高可用設(shè)計(jì)提供參考.
異構(gòu)系統(tǒng);可靠性框圖;可用性;異構(gòu)性;高可用
近年來(lái)實(shí)時(shí)應(yīng)用服務(wù)范圍不斷擴(kuò)大,系統(tǒng)復(fù)雜性持續(xù)提高.物聯(lián)網(wǎng)、云計(jì)算及大數(shù)據(jù)等各種新型技術(shù)的興起,使得具有卓越性價(jià)比、良好可擴(kuò)展性及高可用性的異構(gòu)系統(tǒng)[1]成為解決計(jì)算密集型、數(shù)據(jù)密集型服務(wù)的有效方案[2],如何對(duì)異構(gòu)系統(tǒng)進(jìn)行可用性評(píng)價(jià)也成為研究異構(gòu)系統(tǒng)高可用性的熱點(diǎn)問(wèn)題.
目前國(guó)內(nèi)外系統(tǒng)可用性分析建模方法主要有隨機(jī)Petri網(wǎng)(Stochastic Petri Net,SPN)[3-5]、Markov過(guò)程[6-7]、故障樹(shù)模型[8]及可靠性框圖(Reliability Block Diagram,RBD)[9-11]等.文獻(xiàn)[5]采用隨機(jī)Petri網(wǎng)對(duì)容錯(cuò)服務(wù)器系統(tǒng)進(jìn)行可用性建模評(píng)價(jià),并考慮服務(wù)可用性.文獻(xiàn)[7]采用Markov過(guò)程方法對(duì)熱備k-out-of-n表決系統(tǒng)可靠性進(jìn)行了研究.文獻(xiàn)[12]結(jié)合Markov過(guò)程與隨機(jī)Petri網(wǎng)評(píng)價(jià)雙控制器磁盤(pán)陣列系統(tǒng)的可用性.文獻(xiàn)[11]采用可靠性框圖方法分析評(píng)價(jià)了私有云計(jì)算環(huán)境的可用性.然而針對(duì)異構(gòu)系統(tǒng)可用性的研究較少,缺乏完善有效的可用性建模及評(píng)價(jià)方法.
異構(gòu)系統(tǒng)的重要特點(diǎn)是系統(tǒng)內(nèi)各自治節(jié)點(diǎn)特征、性能及可用性等差異很大,因此,在對(duì)異構(gòu)系統(tǒng)可用性進(jìn)行建模時(shí),不僅要考慮單個(gè)節(jié)點(diǎn)和節(jié)點(diǎn)內(nèi)各部件的自身性能與特征,還要考慮相互制約的各自治節(jié)點(diǎn)集中體現(xiàn)出的異構(gòu)系統(tǒng)整體可用性,給異構(gòu)系統(tǒng)可用性建模評(píng)價(jià)帶來(lái)了諸多困難.筆者對(duì)異構(gòu)性進(jìn)行分類、量化,進(jìn)而采用可靠性框圖方法設(shè)計(jì)實(shí)現(xiàn)異構(gòu)系統(tǒng)的可用性評(píng)價(jià)模型.該模型采用串并行混聯(lián)RBD結(jié)構(gòu),分析可用性度量方法,并對(duì)異構(gòu)系統(tǒng)的可用性進(jìn)行準(zhǔn)確的評(píng)價(jià)度量.對(duì)比Markov過(guò)程模型評(píng)價(jià)結(jié)果,該模型充分考慮了異構(gòu)性對(duì)系統(tǒng)可用性的影響,準(zhǔn)確評(píng)價(jià)系統(tǒng)可用性為異構(gòu)系統(tǒng)的可用性提升提供了理論性參考.
1.1異構(gòu)性分類
異構(gòu)系統(tǒng)是指由多臺(tái)獨(dú)立自治節(jié)點(diǎn)通過(guò)高速互聯(lián)網(wǎng)絡(luò)相互連接而成的高性能、高可用的計(jì)算機(jī)系統(tǒng),各自治節(jié)點(diǎn)的中央處理單元(Central Processing Unit,CPU)處理能力、內(nèi)存容量、I/O及其他資源均不相同.各用戶可向系統(tǒng)內(nèi)任何節(jié)點(diǎn)提交各種不同計(jì)算量和需求的任務(wù),由特定節(jié)點(diǎn)承載的特定服務(wù)來(lái)執(zhí)行并完成對(duì)應(yīng)任務(wù).因此,異構(gòu)系統(tǒng)的異構(gòu)性可分為節(jié)點(diǎn)異構(gòu)性和任務(wù)異構(gòu)性.
任務(wù)異構(gòu)性由具體任務(wù)處理時(shí)間與全部任務(wù)隊(duì)列平均處理時(shí)間的比值來(lái)體現(xiàn).對(duì)節(jié)點(diǎn)異構(gòu)性定義如下.
定義1 類型異構(gòu)性,指不同自治節(jié)點(diǎn)其指令集結(jié)構(gòu)(Instruction Set Architecture,ISA)與操作系統(tǒng)(Operating System,OS)的不相同.
定義2 資源異構(gòu)性,指不同自治節(jié)點(diǎn)資源如CPU、內(nèi)存和I/O資源等的擁有量不同.
特別對(duì)于資源異構(gòu)性,其主要體現(xiàn)在各資源部件的結(jié)構(gòu)和特性上.結(jié)構(gòu)上的異構(gòu)是指各部件操作管理和優(yōu)化方式的不同,特性上的異構(gòu)是指各部件性能參數(shù)的差異.異構(gòu)系統(tǒng)規(guī)模越大,資源異構(gòu)性越突出.
1.2異構(gòu)性量化
根據(jù)上述異構(gòu)性分類及定義2進(jìn)一步對(duì)異構(gòu)系統(tǒng)資源異構(gòu)性進(jìn)行數(shù)學(xué)量化:①設(shè)HS={N1,N2,…,Ni,…,Nn},為異構(gòu)系統(tǒng)集合,n是異構(gòu)系統(tǒng)中自治節(jié)點(diǎn)的個(gè)數(shù),且n≥2;②H為異構(gòu)性,如CPU異構(gòu)性Hcpu,內(nèi)存異構(gòu)性Hmem,I/O異構(gòu)性Hio等;③C為自治節(jié)點(diǎn)中各部件的性能量化值,如對(duì)于CPU,Ccpu(i)為自治節(jié)點(diǎn)i的綜合處理速度;若對(duì)于內(nèi)存,Cmem(i)則指自治節(jié)點(diǎn)i的用戶可用內(nèi)存總量,操作系統(tǒng)占用的內(nèi)存量除外;④RC為自治節(jié)點(diǎn)中各部件的性能量化值相對(duì)所有部件中性能最高部件的比值,有RC(i)=C(i)根據(jù)文獻(xiàn)[13]對(duì)資源異構(gòu)性的數(shù)學(xué)描述,令,n為自治節(jié)點(diǎn)的個(gè)數(shù),得異構(gòu)性公式為
對(duì)于一般的情況,如CPU資源異構(gòu)性,有
2.1異構(gòu)系統(tǒng)RBD可用性評(píng)價(jià)模型
文中提出的異構(gòu)系統(tǒng)RBD可用性評(píng)價(jià)模型如圖1所示,是一個(gè)串行與并行結(jié)構(gòu)混聯(lián)的RBD模型.Task Q為異構(gòu)系統(tǒng)任務(wù)隊(duì)列,其可用性用串行RBD模型來(lái)表示.A?Nodei代表自治節(jié)點(diǎn)可用性,A?Conni代表節(jié)點(diǎn)Nodei到異構(gòu)系統(tǒng)間網(wǎng)絡(luò)連接的可用性.對(duì)于Nodei與Conni所構(gòu)成的子系統(tǒng),其可用性用串行RBD模型來(lái)表示;對(duì)于Nodei與Conni子系統(tǒng)集合,其可用性用并行RBD模型來(lái)表示;對(duì)于每個(gè)Nodei,其可用性受節(jié)點(diǎn)內(nèi)部資源及類型如CPU、內(nèi)存、I/O等部件可用性的影響.另外,模型中任何子模塊可用性均受對(duì)應(yīng)異構(gòu)性的制約,后面會(huì)具體討論各模塊可用性與異構(gòu)性的制約關(guān)系,進(jìn)而度量系統(tǒng)的整體可用性.
圖1 異構(gòu)RBD可用性模型
2.2系統(tǒng)穩(wěn)態(tài)可用度
系統(tǒng)可用性指系統(tǒng)提供正常服務(wù)的時(shí)間占系統(tǒng)總運(yùn)行時(shí)間的比例[14],其度量方式可以是一個(gè)百分?jǐn)?shù)或概率值,更實(shí)際的情況下也可以是年平均系統(tǒng)正常運(yùn)行時(shí)間的比率.系統(tǒng)可用度有3種評(píng)價(jià)模式,瞬時(shí)可用度、平均可用度及穩(wěn)態(tài)可用度.瞬時(shí)可用度指系統(tǒng)在瞬時(shí)時(shí)刻可運(yùn)行的概率;平均可用度指系統(tǒng)在區(qū)域時(shí)間段內(nèi)可用度的平均值;穩(wěn)態(tài)可用度指系統(tǒng)長(zhǎng)期可正常運(yùn)行的概率.通常用穩(wěn)態(tài)可用度來(lái)評(píng)價(jià)計(jì)算機(jī)系統(tǒng)的可用性:ASS=tMTBF/(tMTBF+tMTTR).其中,ASS為系統(tǒng)穩(wěn)態(tài)可用度;tMTBF為系統(tǒng)正常運(yùn)行直至發(fā)生故障的平均時(shí)間,即系統(tǒng)可靠性;tMTTR為系統(tǒng)由故障態(tài)恢復(fù)至工作狀態(tài)所用的平均時(shí)間,即系統(tǒng)可恢復(fù)性.另外,當(dāng)系統(tǒng)故障服從指數(shù)分布時(shí),故障率為一個(gè)常數(shù).設(shè)故障率為λ,有λ=1/tMTBF;當(dāng)系統(tǒng)修復(fù)服從指數(shù)分布時(shí),修復(fù)率為一個(gè)常數(shù).設(shè)修復(fù)率為μ,則有μ=1/tMTTR.
2.3系統(tǒng)可用性度量
設(shè)異構(gòu)性函數(shù)f(H)=1-H/0.5.根據(jù)1.2節(jié)中對(duì)異構(gòu)性量化值H計(jì)算公式及取值范圍的描述,可得f(H)取值分布在0到1區(qū)間,即0 設(shè)自治節(jié)點(diǎn)集合NodeSet={Node1,Node2,…,Noden}.Nodei到異構(gòu)系統(tǒng)的網(wǎng)絡(luò)連接集合ConnSet={Conn1,Conn2,…,Connn}.任意一個(gè)Nodei與Conni組合模塊相對(duì)于其他模塊獨(dú)立,設(shè)其可用性為A? Node?Conni,失效率為F?Node?Conni,有A?Node?Conni+F?Node?Conni=1;設(shè)異構(gòu)系統(tǒng)整體可用性為A? HeteroSys,失效率為F?HeteroSys,有A?HeteroSys+F?HeteroSys=1. 將Nodei與Conni模塊組合看作是局部串行的RBD模型,考慮異構(gòu)性對(duì)模塊的影響,有 對(duì)自治節(jié)點(diǎn)Nodei的可用性A?Nodei,根據(jù)圖1中的描述,從異構(gòu)性量化的角度出發(fā),可將其看作是節(jié)點(diǎn)內(nèi)多個(gè)類型與資源模塊的串聯(lián),有 對(duì)網(wǎng)絡(luò)連接模塊Conn的自身可用性A?Conni,假設(shè)其故障率與修復(fù)率分別為αi和βi,其可用性可通過(guò)公式A?Con ni=βi/(αi+βi)計(jì)算得出.同時(shí)若將自治節(jié)點(diǎn)模塊按異構(gòu)性分類為類型模塊和資源模塊,節(jié)點(diǎn)Nodei類型模塊可用性為A?Node?typei,資源模塊可用性為A?Node?resi,式(3)可進(jìn)一步描述為 其中,A?Node?Conni可由式(2)計(jì)算得出.由異構(gòu)系統(tǒng)可用性計(jì)算公式可知,影響異構(gòu)系統(tǒng)可用性度量的因素包括自治節(jié)點(diǎn)可用性、自治節(jié)點(diǎn)間網(wǎng)絡(luò)連接可用性、所運(yùn)行任務(wù)集合的可用性,以及這3部分的異構(gòu)性.對(duì)于自治節(jié)點(diǎn)還要考慮節(jié)點(diǎn)內(nèi)部異構(gòu)類型及異構(gòu)資源的可用性. 以采用可靠性框圖的可用性模型評(píng)價(jià)異構(gòu)系統(tǒng)為例,圖2描述了異構(gòu)系統(tǒng)的整體硬件體系框架.系統(tǒng)由n個(gè)各自獨(dú)立自治的高性能服務(wù)器節(jié)點(diǎn)構(gòu)成,節(jié)點(diǎn)間通過(guò)高速以太網(wǎng)鏈路相互連接,并由冗余心跳檢測(cè)機(jī)制監(jiān)測(cè)各服務(wù)器節(jié)點(diǎn)的運(yùn)行情況.各節(jié)點(diǎn)通過(guò)虛擬IP技術(shù)透明的為用戶/終端提供高可用服務(wù).各服務(wù)器節(jié)點(diǎn)硬件體系結(jié)構(gòu)支持SMP、cc Numa;處理器支持x86、IA64、AMD、SPARC;支持Infiniband、PCI Express、Hyper Transports等I/O技術(shù);支持網(wǎng)卡、SCSI卡、RAID卡、磁盤(pán)陣列柜等接口卡及外圍設(shè)備;操作系統(tǒng)支持Windows、Linux及AIX. 圖2 異構(gòu)系統(tǒng)硬件體系框架 圖3根據(jù)可靠性框圖的可用性評(píng)價(jià)模型,結(jié)合隨機(jī)Petri網(wǎng)方法描述了異構(gòu)系統(tǒng)內(nèi)自治服務(wù)器節(jié)點(diǎn)的狀態(tài)轉(zhuǎn)換情況.服務(wù)器節(jié)點(diǎn)與網(wǎng)絡(luò)鏈接的4個(gè)運(yùn)行狀態(tài)分別為:正常、故障、修復(fù)及宕機(jī)/關(guān)閉.服務(wù)器節(jié)點(diǎn)或網(wǎng)絡(luò)鏈接平時(shí)處于正常運(yùn)行態(tài);發(fā)生故障時(shí),服務(wù)器節(jié)點(diǎn)宕機(jī),網(wǎng)絡(luò)鏈接關(guān)閉;服務(wù)器節(jié)點(diǎn)或網(wǎng)絡(luò)鏈接修復(fù)后,節(jié)點(diǎn)重新啟動(dòng)并恢復(fù)至正常態(tài). 對(duì)于整個(gè)異構(gòu)系統(tǒng),由圖3中狀態(tài)轉(zhuǎn)換關(guān)系可知,其屬于k/n表決系統(tǒng)[15]范疇.假設(shè)異構(gòu)系統(tǒng)是可修復(fù)系統(tǒng),即任何故障服務(wù)器節(jié)點(diǎn)都可通過(guò)修復(fù)恢復(fù)至正常運(yùn)行態(tài);且由n個(gè)自治節(jié)點(diǎn)組成的異構(gòu)系統(tǒng)中,處于運(yùn)行正常態(tài)的自治節(jié)點(diǎn)個(gè)數(shù)為k,0≤k≤n.當(dāng)1≤k≤n時(shí),異構(gòu)系統(tǒng)能夠?yàn)橛脩?終端提供服務(wù);當(dāng)k=0時(shí),異構(gòu)系統(tǒng)內(nèi)所有服務(wù)器節(jié)點(diǎn)/網(wǎng)絡(luò)鏈接處于宕機(jī)/關(guān)閉狀態(tài),系統(tǒng)不再向用戶/終端提供服務(wù),直到系統(tǒng)內(nèi)自治節(jié)點(diǎn)修復(fù). 圖3 異構(gòu)系統(tǒng)狀態(tài)轉(zhuǎn)換圖 3.1參數(shù)選取 評(píng)價(jià)參數(shù)設(shè)置部分選用文獻(xiàn)[14]中描述的異構(gòu)系統(tǒng)可用性評(píng)價(jià)參數(shù).之后,將得到的系統(tǒng)可用度計(jì)算結(jié)果與文獻(xiàn)[16]中結(jié)果進(jìn)行比較分析,所用到的參數(shù)如表1所示.由于異構(gòu)系統(tǒng)是可修復(fù)系統(tǒng),假設(shè)系統(tǒng)內(nèi)部各自治節(jié)點(diǎn)與網(wǎng)絡(luò)鏈接的修復(fù)時(shí)間均為1 h.期間自治節(jié)點(diǎn)停機(jī)檢修,進(jìn)行系統(tǒng)備份,存儲(chǔ)設(shè)備、磁盤(pán)陣列或連接設(shè)備的維修及更換,有tMTTR1=tMTTR2=…=tMTTRn=1 h;tMTTRconn1=tMTTRconn2=…=tMTTRconnn=1 h;相應(yīng)地,有μnode1=μnode2=…=μnoden=1/h;μconn1=μconn2=…=μconnn=1/h.對(duì)于自治節(jié)點(diǎn)的異構(gòu)性函數(shù)f(Hnode1),f(Hnode2),…,f(Hnoden)與網(wǎng)絡(luò)鏈接異構(gòu)性函數(shù)f(Hconn1),f(Hconn2),…,f(Hconnn),有0< f(Hnode1),f(Hnode2),…,f(Hnoden),f(Hconn1),f(Hconn2),…,f(Hnoden)≤1. 表1 評(píng)價(jià)參數(shù)列表 3.2評(píng)價(jià)結(jié)果與比較分析 對(duì)具有雙節(jié)點(diǎn)的異構(gòu)系統(tǒng)進(jìn)行可用性評(píng)價(jià).從之前對(duì)異構(gòu)性量化的分析也可得知,在異構(gòu)部件為兩個(gè)的情況下,系統(tǒng)內(nèi)部異構(gòu)性差異的體現(xiàn)最為明顯,對(duì)系統(tǒng)可用性的影響最大,評(píng)價(jià)分析相比多部件異構(gòu)系統(tǒng)更具有典型性.考慮自治節(jié)點(diǎn)與網(wǎng)絡(luò)鏈接異構(gòu)性函數(shù)值不變且均為1的情況,即節(jié)點(diǎn)與網(wǎng)絡(luò)鏈接同構(gòu),設(shè)tMTBFconn1=tMTBFconn2=1 000 h;tMTBFnode1=tMTBFnode2=tMTBFnodes.簡(jiǎn)化評(píng)價(jià)模型中任務(wù)隊(duì)列Task Q的部分,對(duì)比采用可靠性框圖的異構(gòu)系統(tǒng)可用性評(píng)價(jià)模型與文獻(xiàn)[16]中使用的Markov過(guò)程方法可用性評(píng)價(jià)模型,結(jié)果如表2所示.說(shuō)明采用RBD的可用性模型能夠?qū)Ξ悩?gòu)系統(tǒng)進(jìn)行準(zhǔn)確的可用性評(píng)價(jià).并且當(dāng)tMTBFnodes值大于1 000 h時(shí),系統(tǒng)可用度可以達(dá)到5個(gè)9的高可用指標(biāo)要求. 表2 RBD/Markov過(guò)程評(píng)價(jià)模型系統(tǒng)可用度結(jié)果比較 圖4(a)描述了自治節(jié)點(diǎn)與網(wǎng)絡(luò)鏈接tMTTF一定,tMTBFnodes與tMTBFconns變化的情況下,異構(gòu)系統(tǒng)可用度的計(jì)算情況.坐標(biāo)系中位于上方的曲線是tMTBFconn1=tMTBFconn2=1 000 h時(shí),tMTBFnodes取值分別為10 h,100 h,500 h,1 000 h時(shí),系統(tǒng)可用性的計(jì)算結(jié)果.坐標(biāo)系中位于下方的曲線是tMTBFnode1=tMTBFnode2=10 h時(shí),tMTBFconns取值分別為10 h,100 h,500 h,1 000 h時(shí),系統(tǒng)可用性的計(jì)算結(jié)果.說(shuō)明在tMTTF一定時(shí),tMTBF越大,異構(gòu)系統(tǒng)可用性越高;另外,一般網(wǎng)絡(luò)鏈接的可靠性要優(yōu)于自治節(jié)點(diǎn),因此,tMTBFnodes對(duì)系統(tǒng)可用性影響要大于tMTBFconns,采用提升tMTBFnodes所帶來(lái)的系統(tǒng)可用性提高要明顯高于提升tMTBFconns. 圖4 異構(gòu)系統(tǒng)可用性評(píng)價(jià)結(jié)果 考慮tMTTR變化的情況,假設(shè)tMTBFnodes與tMTBFconns值不變,tMTBFnodes=100 h,tMTBFconns=1 000 h;tMTTR1=tMTTR2=tMTTRconn1=tMTTRconn2=tMTTRs.選取4個(gè)不同tMTTRs值(10 h,100 h,500 h,1 000 h)計(jì)算異構(gòu)系統(tǒng)的可用性,結(jié)果如圖4(b)所示.計(jì)算結(jié)果說(shuō)明系統(tǒng)可用性隨tMTTRs的增加而逐漸降低,最后趨于0. 考慮自治節(jié)點(diǎn)異構(gòu)性函數(shù)變化,而網(wǎng)絡(luò)鏈接異構(gòu)性函數(shù)不變且仍為1的情況,即自治節(jié)點(diǎn)異構(gòu),網(wǎng)絡(luò)鏈接同構(gòu).設(shè)異構(gòu)系統(tǒng)中自治節(jié)點(diǎn)異構(gòu)性函數(shù)值f(Hnode1)=f(Hnode2)=f(Hnodes)={0,0.1,0.2,…,1.0},取值范圍為0 對(duì)多節(jié)點(diǎn)異構(gòu)系統(tǒng)進(jìn)行可用性評(píng)價(jià).設(shè)系統(tǒng)內(nèi)自治節(jié)點(diǎn)tMTBFnodes=1 000 h,各自治節(jié)點(diǎn)與網(wǎng)絡(luò)鏈接的修復(fù)時(shí)間均為1 h,f(H)取值分別為0.2,0.5,0.8,異構(gòu)節(jié)點(diǎn)數(shù)變化的情況下異構(gòu)系統(tǒng)可用性的計(jì)算結(jié)果如圖5所示.說(shuō)明異構(gòu)系統(tǒng)中自治節(jié)點(diǎn)越多,系統(tǒng)可用性越高;在相同節(jié)點(diǎn)數(shù)的情況下,異構(gòu)函數(shù)值越大,即節(jié)點(diǎn)異構(gòu)性越小,系統(tǒng)可用性越高.綜上所述,可通過(guò)提高自治節(jié)點(diǎn)、網(wǎng)絡(luò)鏈接的平均故障時(shí)間間隔、降低系統(tǒng)內(nèi)各部件修復(fù)時(shí)間、降低系統(tǒng)異構(gòu)性及增加節(jié)點(diǎn)冗余個(gè)數(shù)的方法,以達(dá)到提升異構(gòu)系統(tǒng)可用性及系統(tǒng)高可用的目的. 圖5 節(jié)點(diǎn)數(shù)對(duì)可用性的影響 從分析異構(gòu)系統(tǒng)異構(gòu)性,對(duì)異構(gòu)性進(jìn)行分類、性量化入手,筆者提出一種可靠性框圖的異構(gòu)系統(tǒng)可用性評(píng)價(jià)模型.評(píng)價(jià)模型采用串并行混聯(lián)RBD結(jié)構(gòu),結(jié)合系統(tǒng)異構(gòu)性分析異構(gòu)系統(tǒng)可用性度量方法.模型以典型雙節(jié)點(diǎn)和多節(jié)點(diǎn)異構(gòu)系統(tǒng)為例,對(duì)比Markov過(guò)程模型并對(duì)系統(tǒng)可用性進(jìn)行評(píng)價(jià).評(píng)價(jià)結(jié)果與比較分析表明該模型不僅能準(zhǔn)確對(duì)異構(gòu)系統(tǒng)可用性進(jìn)行評(píng)價(jià),而且從數(shù)學(xué)量化角度考慮系統(tǒng)異構(gòu)性對(duì)可用性的影響,為研究異構(gòu)系統(tǒng)可用性提升方法以及異構(gòu)系統(tǒng)高可用提供了有意義的理論性參考. [1]HAMID A,JORGE G.List Scheduling Algorithm for Heterogeneous System by an Optimistic Cost Table[J].IEEE Transactions on Parallel and Distributed Systems,2014,25(3):682-694. [2]KIM J S,HENRIQUE A,ALAN S.Principles for Designing Data/Compute-Intensive Distributed Applications and Middleware Systems for Heterogeneous Environments[J].Journal of Parallel&Distributed Computing,2007,67(7): 755-771. [3]林闖.隨機(jī)Petri網(wǎng)和系統(tǒng)性能評(píng)價(jià)[M].2版.北京:清華大學(xué)出版社,2009. [4]李曄,王映輝,于振華.信息物理融合系統(tǒng)的面向?qū)ο驪etri網(wǎng)建模[J].西安電子科技大學(xué)學(xué)報(bào),2014,41(2): 165-171. LI Ye,WANG Yinghui,YU Zhenhua.Formal Modeling of Cyber-physical Systems Using Object-oriented Petri Nets [J].Journal of Xidian University,2014,41(2):165-171. [5]SALFNER F,WOLTER K.A Petri Net Model for Service Availability in Redundant Computing Systems[C]// Proceedings of Winter Simulation Conference.Piscataway:IEEE,2009:819-826. [6]SHAHRZAD F R,MIN X,KIEN M N,et al.Dynamic Availability Assessment and Optimal Component Design of Multi-state Weighted k-out-of-n Systems[J].Reliability Engineering and System Safety,2014,123:57-62. [7]SUPRASAD V A,HOANG P,PAVINDRA B M.Reliability Characteristics of k-out-of-n Warm Standby Systems[J]. IEEE Transactions on Reliability,2012,61(4):1007-1018. [8]ANTHONY M,AOWLING R,DRNO N,et al.Reliability Analysis for Power to Fire Pump Using Fault Tree and RBD [J].IEEE Transactions on Industry Applications,2013,49(2):997-1003. [9]YANG B,HU Y M,HUANG C Y.An Architecture-based Multi-objective Optimization Approach to Testing Resource Allocation[J].IEEE Transactions on Reliability,2015,64(1):497-515. [10]ERICA S,FERNANDO L,EDUARDO T,et al.A Modeling Approach for Cloud Infrastructure Planning Considering Dependability and Cost Requirements[J].IEEE Transactions on System,Man,and Cybernetics:Systems,2015,45 (4):549-558. [11]SOUZA D,MATOS R,ARAUJO J,et al.EucaBomber:Experimental Evaluation of Availability in Eucalyptus Private Clouds[C]//Proceedings of International Conference on Systems,Man,and Cybernetics.Piscataway:IEEE,2013: 4080-4085. [12]WAN Y P,FENG D,YANG T M,et al.The Adaptive Heartbeat Design of High Availability RAID Dual-Controller [C]//Proceedings of International Conference on Multimedia and Ubiquitous Engineering.Piscataway:IEEE,2008: 45-50. [13]ZHANG X D,QIU Y X,XIAO L.Improving Distributed Workload Performance by Sharing both CPU and Memory Resources[C]//Proceedings of International Conference on Distributed Computing Systems.Piscataway:IEEE,2000: 233-241. [14]HEIMANN D,MITTAL N,TRIVEDI K S.Availability and Reliability Modeling for Computer Systems[J].Advances in Computers,1990,31:175-233. [15]方永峰,陳建軍,曹鴻鈞.可修復(fù)的k/n表決系統(tǒng)的可靠性分析[J].西安電子科技大學(xué)學(xué)報(bào),2014,41(5):180-184. FANG Yongfeng,CHEN Jianjun,CAO Hongjun.Analysis of Dynamic Reliability of the Repairable k-out-of-n System under Several Times Random Shocks[J].Journal of Xidian University,2014,41(5):180-184. [16]SUN J,GONG W F,DONG X S,et al.High Availability Analysis and Evaluation of Heterogeneous Dual Computer Fault-Tolerant System[C]//Proceedings of International Conference on Software Engineering and Service Science. Piscataway:IEEE,2014:460-464. (編輯:齊淑娟) Availability evaluation model for the heterogeneous system based on RBD SUN Jian,ZHANG Xingjun,DONG Xiaoshe In order to cope with difficulty of heterogeneous system availability evaluation caused by autonomous node performance and characteristic differences,the paper proposes an availability evaluation model based on the reliability block diagram(RBD).First,we analyze and catalog system heterogeneity from the angle of nodes and tasks,and quantify resource heterogeneity.Then by heterogeneity classification,we build a serial and parallel mixed RBD availability evaluation model,and discuss the availability measurement method of nodes and the whole heterogeneous system.Availability evaluation takes the dual-computer and multi node heterogeneous system for example,and compares evaluation results with the Markov process availability model.Results show that the model we propose can evaluate the heterogeneous system with accuracy,and hence,provide for research on availability improving and high-availability design of the heterogeneous system. heterogeneous system;reliability block diagram;availability;heterogeneity;high-availability TP302.7 A 1001-2400(2016)03-0190-07 10.3969/j.issn.1001-2400.2016.03.033 2015-06-15 國(guó)家“863計(jì)劃”資助項(xiàng)目(2008AA01A202) 孫 健(1983-),男,西安交通大學(xué)博士研究生,E-mail:sunjian83@sina.com.3 可用性評(píng)價(jià)與比較分析
4 結(jié)束語(yǔ)
(School of Electronic and Information Engineering,Xi’an Jiaotong Univ.,Xi’an 710049,China)