孔陽
摘 要:計(jì)算機(jī)的應(yīng)用與普及改變了人們的生活方式,并且與其它技術(shù)相結(jié)合,對(duì)社會(huì)發(fā)展產(chǎn)生了重大影響?,F(xiàn)如今計(jì)算機(jī)已經(jīng)成為了人們生活的一部分,計(jì)算機(jī)功能的正常發(fā)揮需要相關(guān)方面為其提供支持與保障,而計(jì)算機(jī)硬件系統(tǒng)作為其功能實(shí)現(xiàn)的基礎(chǔ),需要做好維護(hù)工作。本文就基于GSPN的計(jì)算機(jī)硬件系統(tǒng)可靠性分析作簡要闡述。
關(guān)鍵詞:基于GSPN;計(jì)算機(jī)硬件系統(tǒng);可靠性分析
中圖分類號(hào):TP303 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2017)21-0031-02
對(duì)計(jì)算機(jī)硬件系統(tǒng)動(dòng)態(tài)特征進(jìn)行準(zhǔn)確的表述,依據(jù)傳統(tǒng)的方法難以實(shí)現(xiàn),因此需要通過其它方法來達(dá)成工作目標(biāo),對(duì)計(jì)算機(jī)在運(yùn)行過程中其硬件系統(tǒng)變化進(jìn)行準(zhǔn)確的分析,基于GSPN對(duì)計(jì)算機(jī)的硬件系統(tǒng)進(jìn)行可靠性分析,研究工作已經(jīng)取得了一定成果。
1 可靠性問題產(chǎn)生原因
在計(jì)算機(jī)問世的時(shí)候可靠性問題就被提出,并且受到當(dāng)時(shí)的技術(shù)與生產(chǎn)工藝條件的影響,正常運(yùn)行的時(shí)間非常短,而隨著技術(shù)發(fā)展,計(jì)算機(jī)運(yùn)行可靠性有所增加,但是仍然會(huì)存在某些方面問題,對(duì)于計(jì)算機(jī)可靠性的要求可以從以下方面來論述其原因。
隨著社會(huì)與技術(shù)的發(fā)展,計(jì)算機(jī)的功能在不斷的完善,并且其復(fù)雜性有所提升,系統(tǒng)在運(yùn)行過程中出錯(cuò)的概率相應(yīng)的就會(huì)增加,因此需要對(duì)計(jì)算機(jī)采取一定措施降低其出錯(cuò)的概率。結(jié)合到當(dāng)下社會(huì)環(huán)境,信息時(shí)代數(shù)據(jù)信息量大,并且對(duì)于數(shù)據(jù)處理結(jié)果方面的要求高,計(jì)算機(jī)作為關(guān)鍵設(shè)備需要確保其能夠正常工作,某些關(guān)鍵崗位或者是部門一旦出現(xiàn)了問題就會(huì)造成難以預(yù)料的后果與損失。計(jì)算機(jī)工作的環(huán)境出現(xiàn)了變化,并且在某些情況下會(huì)受到濕度,溫度,振動(dòng)等方面影響。干擾因素的存在增大的計(jì)算機(jī)出錯(cuò)的可能性[1]。
2 可靠性概念及其它
可靠性是可信性在某一方面的屬性,系統(tǒng)的可靠程度可以將其定義為在一定的工作時(shí)間下,處于規(guī)定的工作狀態(tài),規(guī)定的功能可以完成的概率??煽慷扰c失效元件存在一定的聯(lián)系,元件的失效率可以將其分為三個(gè)階段,失效率最高的是在最初階段,其原因可能是在初期元件存在的缺陷與問題比較多,中間階段將其稱之為生存期,該階段元件趨于穩(wěn)定,而經(jīng)過了該時(shí)期之后失效率又會(huì)迅速的增加,也可以將其稱之為晚期失效期,三個(gè)不同的階段可以用一條曲線來表示[2]。
從數(shù)學(xué)的角度來講,系統(tǒng)可靠度是一個(gè)概率值,代表了系統(tǒng)平均使用壽命,并且對(duì)于不可維修或者是可以進(jìn)行維修的系統(tǒng)來說,平均壽命的含義是存在區(qū)別的。系統(tǒng)的維修性則是表示在規(guī)定的條件下,依據(jù)規(guī)定的程序及方法應(yīng)用從而使系統(tǒng)保持或者是恢復(fù)到到正常功能狀態(tài),對(duì)系統(tǒng)的可維修性進(jìn)行評(píng)估時(shí),通常應(yīng)用的是平均維修時(shí)間與可維修度進(jìn)行表述。
3 傳統(tǒng)的可靠性評(píng)估方法
系統(tǒng)可靠性評(píng)估工作的方法包括了,故障樹分析方法,事件樹分析,二項(xiàng)式開展,可靠性框圖分析,狀態(tài)圖分析等,不同的方法其依據(jù)的理論基礎(chǔ)不同,分析問題的角度也會(huì)存在差異,所體現(xiàn)的優(yōu)勢(shì)與不足也有差別。
4 GSPN
4.1 GSPN相關(guān)定義及表述
從廣義理論的層面,用八個(gè)元素組為基礎(chǔ)定義隨機(jī)Petri網(wǎng),即GSPN=(P、T、I、O、H、M、W0、λ)。其中這些不同的字母其代表的含義也不相同,按照其排列先后順序,各字母所代表的含義依次是:庫所的全部有窮集合,變遷所有集合,輸入弧有窮集合,輸出弧有窮集合,禁止弧有窮集合,系統(tǒng)初始標(biāo)識(shí)集合,弧權(quán)函數(shù)有窮集合,變遷集合對(duì)應(yīng)于λ。
更詳細(xì)的表述如下:在計(jì)算機(jī)工作的過程中,元素用法庫所主要作用在于表述硬件系統(tǒng)的資源以及狀態(tài);瞬時(shí)變遷是用于表述硬件系統(tǒng)工作過程中運(yùn)行邏輯與控制;時(shí)間變遷則是表述了硬件系統(tǒng)運(yùn)轉(zhuǎn)過程中不同的事件;有向弧則主要表述了計(jì)算機(jī)工作狀態(tài)情況下的時(shí)間與工作狀態(tài)的因果聯(lián)系;在計(jì)算機(jī)硬件系統(tǒng)運(yùn)行過程中,禁止弧表述的是運(yùn)行邏輯與控制;標(biāo)記則主要是用來表述硬件系統(tǒng)和行為的變化。
GSPN是近年隨著Petri發(fā)展而產(chǎn)生的一種較新穎的分析方法,其主要針對(duì)的對(duì)象是系統(tǒng)性能。
4.2 硬件系統(tǒng)GSPN模型
庫所結(jié)構(gòu)中的參數(shù)含義分別表示為:計(jì)算機(jī)硬件系統(tǒng)運(yùn)行狀態(tài)正常時(shí)用P1標(biāo)記,運(yùn)行異常時(shí)用P2標(biāo)記,存在臨時(shí)性的故障用P3標(biāo)記,系統(tǒng)硬件發(fā)生永久性故障用P4標(biāo)記,計(jì)算機(jī)異常并且可自動(dòng)恢復(fù)用P5標(biāo)記,計(jì)算機(jī)存在故障且無法自動(dòng)恢復(fù)用P6標(biāo)記,這種情況下需要工作人員進(jìn)行維修與檢查[3]。
變遷含義的參數(shù)含義分別為:硬件系統(tǒng)運(yùn)行階段出現(xiàn)異常情況用T1標(biāo)記,永久性的故障用T2標(biāo)記,臨時(shí)性的故障用T3標(biāo)記,檢查維護(hù)以后系統(tǒng)轉(zhuǎn)入正常運(yùn)轉(zhuǎn)狀態(tài)用T4標(biāo)記,當(dāng)發(fā)生故障時(shí)系統(tǒng)能自動(dòng)恢復(fù)正常運(yùn)轉(zhuǎn)用T5標(biāo)記,無法使系統(tǒng)進(jìn)行自恢復(fù)功能則標(biāo)記為T6,故障無法解決,故障已經(jīng)發(fā)生了變化并且成為了永久性故障時(shí)用T7標(biāo)記。綜合計(jì)算機(jī)硬件系統(tǒng)的實(shí)際情況,分析得到模型的具體原理:在正常工作情況下,如果硬件系統(tǒng)的基本單元發(fā)生故障,并且其基本單元也出現(xiàn)異常,該異常情況是無法確定的,可能是永久性的故障,也可以是暫時(shí)性的。后者可以將其細(xì)分為兩種工作狀態(tài),系統(tǒng)可以自動(dòng)恢復(fù)至正常工作狀態(tài)和無法自動(dòng)恢復(fù)到正常工作狀態(tài)。如果能夠自動(dòng)恢復(fù),在系統(tǒng)基本單元下可以自行恢復(fù),如果無法進(jìn)行自動(dòng)恢復(fù),就需要人工維修從而找出問題所在并解決。對(duì)于永久性的故障而言,需要通過人工維修的方式從而使其恢復(fù)到正常的工作狀態(tài)。
4.3 GSPN模型設(shè)計(jì)及硬件系統(tǒng)分析
簡化假設(shè)主要是針對(duì)于較為關(guān)鍵模型分析而言的,對(duì)于這一類型的模型分析,工作需要依據(jù)流程開展,首先是對(duì)運(yùn)行狀態(tài)進(jìn)行區(qū)分,判斷其屬于故障或者是正常的范圍,之后假設(shè)硬件系統(tǒng)基本單元存在的故障均可以在λ基礎(chǔ)上通過泊松過程實(shí)現(xiàn),最后將所有硬件系統(tǒng)維修成功作為條件,使其處于維修率泊松過程中。從計(jì)算機(jī)硬件系統(tǒng)GSPN運(yùn)作原理、作用分析,其作用是對(duì)計(jì)算機(jī)硬件系統(tǒng)的故障變化情況進(jìn)行反饋,計(jì)算機(jī)運(yùn)轉(zhuǎn)在正常工作狀態(tài)時(shí)用PW標(biāo)記。硬件系統(tǒng)部分發(fā)生故障時(shí)用Pf來標(biāo)記,由于某些因素產(chǎn)生了干擾使硬件系統(tǒng)的基本單元產(chǎn)生故障用Tf標(biāo)記,Tr標(biāo)記的故障情況可以通過一定的維修方式解決,之后系統(tǒng)可以恢復(fù)正常工作。endprint
建立模型后,模型中矩形表示計(jì)算機(jī)硬件系統(tǒng)發(fā)生了全局性故障,矩形Yi表示其故障的位置在第i個(gè)單元上,其中i=1、2、3。硬件系統(tǒng)基本單元如果出現(xiàn)了故障,那么則用圓形Xi表示,并且i=1、2、3,需要注意故障邏輯關(guān)系。可靠性分析則主要是通過模型達(dá)成目標(biāo),同時(shí)需要建立硬件系統(tǒng)GSPN分析模型。
4.4 可靠性測(cè)評(píng)方法建立
首先是建立模型,之后對(duì)狀態(tài)圖進(jìn)行化簡,依據(jù)化簡的結(jié)果建立方程組。單工備份系統(tǒng)中,包含了備份備件與工作部件,代表部件的令牌在庫所中的分布就代表了系統(tǒng)不同狀態(tài)。GSPN共有四個(gè)庫所,工作部件如果失效后就需要切換到備份部件,因此可以認(rèn)為能夠進(jìn)行修理的部分是備份部件,同時(shí)考慮到瞬間轉(zhuǎn)移存在,可以對(duì)狀態(tài)圖進(jìn)行簡化。分別表示部份部件與工作部件二者故障率,之后通過系統(tǒng)模型對(duì)系統(tǒng)的可靠程度進(jìn)行求解。
依據(jù)系統(tǒng)GSPN模型可以得到系統(tǒng)可達(dá)樹,將可達(dá)樹的每一個(gè)節(jié)點(diǎn)看作是模型中的狀態(tài),就可以得到系統(tǒng)模型,此種方法可以將其稱作是同構(gòu)法。
如果為系統(tǒng)建立Markov模型,或者是將系統(tǒng)同構(gòu)改成是該模型,當(dāng)系統(tǒng)部件增加時(shí),模型狀態(tài)就會(huì)增加并且是呈現(xiàn)出指數(shù)狀態(tài),對(duì)于GSPN模型而言,當(dāng)系統(tǒng)部件增加時(shí),模型變化只是處所中的令牌數(shù),模型轉(zhuǎn)型,結(jié)構(gòu),處所都保持原有的狀況不變。
以CPU模塊的GSPN模型進(jìn)行說明,假設(shè)庫所pc中初始標(biāo)記為3,其含義是有三個(gè)CPU在剛開始工作的時(shí)候處于正常工作狀態(tài),延時(shí)變遷則用來表述失效變遷這一過程,假設(shè)每個(gè)CPU模塊失效的時(shí)間服從于一定參數(shù)的指數(shù)分布隨機(jī)變量。因此變遷的點(diǎn)火率就依賴于庫所PC中標(biāo)記個(gè)數(shù),當(dāng)庫所的標(biāo)記個(gè)數(shù)出現(xiàn)變化時(shí),點(diǎn)火率也會(huì)發(fā)生同樣的變化。在不同的表決系統(tǒng)下,能夠容忍失效的CPU數(shù)量是不同的,2/3表決系統(tǒng),最多允許失效的CPU數(shù)量是1,當(dāng)庫所標(biāo)記只有一個(gè)標(biāo)記時(shí)則表明系統(tǒng)失效。庫所中pec標(biāo)記數(shù)則表示的是已經(jīng)失效但是還沒有通過檢測(cè)的模塊數(shù)量。模塊失效后,可以分為兩類情況,一類是可以通過系統(tǒng)檢測(cè)機(jī)進(jìn)行判斷,而另一類則是不能通過系統(tǒng)檢測(cè)機(jī)進(jìn)行判斷。由于系統(tǒng)自檢與運(yùn)行是保持同步的,因此就可以認(rèn)為通過自檢來判斷模塊數(shù)量是不需要給予單獨(dú)時(shí)間的。庫所PCD標(biāo)記數(shù)則表示已經(jīng)檢測(cè)出故障,但是故障尚未能得到有效修理。如果模塊的故障無法進(jìn)行檢測(cè),就會(huì)進(jìn)入到失效工作狀態(tài),失效的模塊數(shù)則是通過pcf來表示,模塊修理的過程用TCR來表示。假設(shè)CPU修理模塊服從于某一參數(shù)的指數(shù)分布,并且可以同時(shí)對(duì)多個(gè)模塊進(jìn)行修理,則變遷trc點(diǎn)火率可以通過相應(yīng)的表達(dá)式表示。
5 GSPN方法改進(jìn)研究
在通過隨機(jī)網(wǎng)定義了兩種不同的轉(zhuǎn)移,瞬間轉(zhuǎn)移從選通到點(diǎn)火無需時(shí)間,隨機(jī)延時(shí)轉(zhuǎn)移這一過程中需要的時(shí)間則是一個(gè)隨機(jī)變量并且服從指數(shù)分布。為了使隨機(jī)Petri網(wǎng)對(duì)系統(tǒng)分析與計(jì)算的能力增強(qiáng)。在某些情況下,需要對(duì)點(diǎn)火延遲時(shí)間賦予分布函數(shù),從而使建模的過程中與實(shí)際工作二者間更加相符。但是從另一外方面來考慮,該模型本來就具有一定的復(fù)雜性,分析與模擬的能力增加后,模型求解問題也會(huì)變得更加的復(fù)雜,因此在使用該模型對(duì)計(jì)算機(jī)系統(tǒng)進(jìn)行評(píng)價(jià)時(shí),點(diǎn)火的過程通常都將其假設(shè)為0,或者是利用隨機(jī)函數(shù),函數(shù)具指數(shù)分布,而此種做法又會(huì)與實(shí)際工作狀況不符[4]。
后來在研究工作進(jìn)行過程中,研究人員提出了具有延時(shí)的DSPN(deterministic and stochastic Petri nets)模型,該模型擁有三種類型轉(zhuǎn)移,確定時(shí)延轉(zhuǎn)移,無需時(shí)間的瞬時(shí)轉(zhuǎn)移,隨機(jī)進(jìn)延轉(zhuǎn)換。該模型與GSPN模型相比,其表述能力更強(qiáng)。但是由于其模型中存在確定時(shí)延轉(zhuǎn)移,無法通過建立方程組的方法進(jìn)行求解,模型雖然具有一定好處,但是無法利用其對(duì)實(shí)際問題進(jìn)行求解,對(duì)于此類模型,求解工作通通常是利用仿真方法。對(duì)該模型的確定時(shí)延轉(zhuǎn)移進(jìn)行重構(gòu),從而獲得能夠逼近原有模型的GSPN模型。
6 結(jié)語
計(jì)算機(jī)及其相關(guān)技術(shù)與社會(huì)發(fā)展已經(jīng)緊密的聯(lián)系在一起,并且隨著社會(huì)發(fā)展,計(jì)算機(jī)在生活中應(yīng)用的范圍將會(huì)更加擴(kuò)大化,功能更加強(qiáng)大的同時(shí),對(duì)于其可靠性的要求也會(huì)相應(yīng)提升??煽啃钥梢詮牟煌姆矫娑鄠€(gè)角度衡量,但是其基本的前提是能夠保證工作的正常開展。為了提升計(jì)算機(jī)硬件設(shè)施的可靠性就需要從影響到其可靠性的因素著手,從而使采用的措施具有針對(duì)性,以確保計(jì)算機(jī)能夠更好的為社會(huì)發(fā)展進(jìn)步服務(wù)。
參考文獻(xiàn)
[1]谷春英,姚青山.基于GSPN的計(jì)算機(jī)硬件系統(tǒng)可靠性分析[J].微電子學(xué)與計(jì)算機(jī),2013,(6):122-125.
[2]馬進(jìn)毅.基于GSPN的計(jì)算機(jī)硬件系統(tǒng)的可靠性研究[J].信息技術(shù)與信息化,2015,(8):145-146.
[3]李寧.基于GSPN的計(jì)算機(jī)硬件系統(tǒng)可靠性研究[J].電子制作,2015,(11z):31.
[4]陳靜.試論計(jì)算機(jī)硬件系統(tǒng)維護(hù)原則與方法[J].科技與企業(yè),2015,(4):113.endprint