[摘要]事務(wù)處理形容錯(cuò)計(jì)算機(jī)可用性測(cè)試中,會(huì)出現(xiàn)一些列問題,如目標(biāo)系統(tǒng)數(shù)量較少、對(duì)測(cè)試時(shí)長(zhǎng)有限制等問題,針對(duì)這些問題設(shè)計(jì)的可用性評(píng)測(cè)和相應(yīng)的系統(tǒng),主要用于事務(wù)處理形容錯(cuò)計(jì)算機(jī)可用性指標(biāo)的評(píng)測(cè)中。
[關(guān)鍵詞]事務(wù)處理;容錯(cuò)計(jì)算機(jī);可用性評(píng)測(cè);設(shè)計(jì)
事務(wù)處理型容器計(jì)算機(jī)對(duì)事務(wù)處理能力和可用性要求極高,尤其是長(zhǎng)時(shí)間、高效率、較好穩(wěn)定性的處理能力,一旦系統(tǒng)出現(xiàn)故障,其造成的損失將不可估量。因此,該類計(jì)算機(jī)可用性測(cè)評(píng)技術(shù)的研究顯得格外重要。本研究將評(píng)估與實(shí)測(cè)技術(shù)集于一體進(jìn)行研究。
一、事務(wù)處理型容錯(cuò)計(jì)算機(jī)可用性評(píng)測(cè)方法
在傳統(tǒng)研究中,往往側(cè)重評(píng)估方法,但實(shí)際測(cè)試方法較少。計(jì)算機(jī)系統(tǒng)評(píng)估類方法主要是在對(duì)待測(cè)系統(tǒng)整個(gè)工作過程和狀態(tài)進(jìn)行分析的基礎(chǔ)上,建立相應(yīng)的系統(tǒng)模型,通過測(cè)試軟件進(jìn)行求解操作,最后計(jì)算出實(shí)用的評(píng)估數(shù)據(jù)。研究初期,評(píng)估時(shí)往往估算失效數(shù)據(jù),其結(jié)果實(shí)踐性較差,并會(huì)受到測(cè)試時(shí)間和極其自身的影響,耗費(fèi)大量的人力物力,實(shí)操性較差。具有代表性的是Sun公司的R-Cubed層次框架、歐盟IST計(jì)劃中的DBench項(xiàng)目等。(1)R-Cubed層次框架用該種方法進(jìn)行可用性評(píng)測(cè),主要是通過故障發(fā)生率、可恢復(fù)性及魯棒性等屬性來對(duì)可用性進(jìn)行刻畫,通過對(duì)實(shí)際故障的發(fā)生率,在此基礎(chǔ)上建立可用性分析,并將系統(tǒng)維護(hù)引起的不可用問題考慮在內(nèi),分析其他因素的影響。(2)DBench項(xiàng)目該項(xiàng)目是歐盟多所大學(xué)為制定計(jì)算機(jī)系統(tǒng)可信性相關(guān)規(guī)范而共同探討。在測(cè)量相對(duì)可信性時(shí)將故障注入作為一項(xiàng)技術(shù)手段,在線處理事務(wù)環(huán)境的測(cè)量,制定了特別的基本程序。
二、事務(wù)處理型容錯(cuò)計(jì)算機(jī)可用性設(shè)計(jì)與實(shí)現(xiàn)
事務(wù)處理型容錯(cuò)計(jì)算機(jī)可用性測(cè)評(píng)系統(tǒng)在測(cè)試時(shí),主要面臨著系統(tǒng)數(shù)量不多、時(shí)長(zhǎng)限制、應(yīng)用環(huán)境非真實(shí)等問題,要解決這些問題,其系統(tǒng)組成需要包括:故障注入平臺(tái)、可用性測(cè)試套件、應(yīng)用負(fù)載模擬系統(tǒng)等。
(一)故障注入平臺(tái)
該平臺(tái)通常由三部分組成:測(cè)試控制服務(wù)、故障注入工具集和服務(wù)。通過網(wǎng)絡(luò)將測(cè)試終端機(jī)和待測(cè)試系統(tǒng)進(jìn)行連接,在操作人員的指令操作下,測(cè)試控制服務(wù)進(jìn)行故障注入策略、指令發(fā)布、結(jié)果分析等操作;故障注入服務(wù)則對(duì)上述結(jié)果進(jìn)行接收。并生成記錄,將其反饋給控制系統(tǒng)進(jìn)行最終處理。主要運(yùn)行結(jié)構(gòu)如下圖1。
(二)應(yīng)用負(fù)載模擬系統(tǒng)
如下圖2所示,應(yīng)用負(fù)載模擬系統(tǒng)的主要工作流程,包括從初始化目標(biāo)機(jī)數(shù)據(jù)庫(kù)及模塊參數(shù)的確立到運(yùn)行結(jié)束時(shí)數(shù)據(jù)的監(jiān)控等多個(gè)環(huán)節(jié)。
根據(jù)上圖流程,可知整個(gè)流程主要由負(fù)載驅(qū)動(dòng)模塊、目標(biāo)系統(tǒng)模塊等組成,負(fù)載應(yīng)用模塊先發(fā)起事務(wù)請(qǐng)求,按照一定的流程操作,并對(duì)執(zhí)行結(jié)果進(jìn)行及時(shí)更新。
(三)可用性測(cè)試套件
事務(wù)處理型容錯(cuò)計(jì)算機(jī)主要通過故障隔離設(shè)計(jì)、多余部件設(shè)置等來達(dá)到可用性目的,并在設(shè)計(jì)中用用測(cè)試套件,主要是針對(duì)高可用性功能的設(shè)計(jì),在測(cè)試終端機(jī)上運(yùn)行可用性測(cè)試配套件的同時(shí),注入故障平臺(tái),以便配合完成整個(gè)操作步驟。一般包括平均恢復(fù)時(shí)間、冗余度等多個(gè)測(cè)試工具。在冗余度測(cè)試中,主要是測(cè)試冗余部件的程度,同樣采取故障注入技術(shù),使冗余各部件失效,采用系統(tǒng)日志信息對(duì)目標(biāo)系統(tǒng)運(yùn)行狀態(tài)進(jìn)行判定,分析出系統(tǒng)正常運(yùn)行狀態(tài)時(shí)最小冗余部件個(gè)數(shù),從而得出部件級(jí)別的可靠性框架圖??捎眯詼y(cè)試流程主要如下圖3。
三、測(cè)試結(jié)果分析
(一)結(jié)果分析
將上述包括故障注入平臺(tái)、可用性測(cè)試及控制服務(wù)等再累的測(cè)試系統(tǒng)同時(shí)應(yīng)用到測(cè)試終端機(jī)和系統(tǒng)功能的測(cè)試中。通過長(zhǎng)時(shí)間的測(cè)試,對(duì)其結(jié)果進(jìn)行分析和處理,對(duì)冗余部件最小個(gè)數(shù)信息、部件具體列表、相關(guān)測(cè)試性能、故障隔離功能、子功能性能的等進(jìn)行數(shù)據(jù)收據(jù),并通過更換相應(yīng)部件等多冗余部件進(jìn)行多次測(cè)試,了解其冗余程度。
(二)結(jié)論
本文就事務(wù)處理型容錯(cuò)計(jì)算機(jī)系統(tǒng)的可用性評(píng)測(cè)系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)的問題進(jìn)行探討,提出了相應(yīng)的評(píng)測(cè)方法,并在此基礎(chǔ)上,設(shè)計(jì)可用性評(píng)測(cè)系統(tǒng),并了解其實(shí)現(xiàn)的可能性和有效性。
結(jié)語
綜上所述,隨著社會(huì)信息技術(shù)的不斷發(fā)展,電子計(jì)算機(jī)已被應(yīng)用到各個(gè)領(lǐng)域,在金融等關(guān)鍵領(lǐng)域的應(yīng)用中,如果出現(xiàn)系統(tǒng)失效現(xiàn)象,會(huì)帶來嚴(yán)重的損失。
參考文獻(xiàn)
[1]魏晨輝.高端容錯(cuò)計(jì)算機(jī)故障日志分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].2011.
[2]馮懿.復(fù)雜計(jì)算機(jī)系統(tǒng)可用性評(píng)測(cè)技術(shù)研究[D].哈爾濱工業(yè)大學(xué),2013.
[3]劉昊.計(jì)算機(jī)可用性建模與評(píng)估工具的設(shè)計(jì)與實(shí)現(xiàn)[D].哈爾濱工業(yè)大學(xué),2011.