王春暉,李曉鋼,陳晧暉,閆凱
(1.海裝重大專項裝備項目管理中心,北京 100071; *.北京航空航天大學,北京 100083;2.中國人民解放軍32382部隊,河南 471000; 3.北京遙感設(shè)備研究所,北京 100854)
隨著高科技的發(fā)展,國防事業(yè)朝著高精尖技術(shù)突飛猛進。無人機產(chǎn)品作為當前在高空領(lǐng)域不可替代的攻守兼?zhèn)涞能娦璁a(chǎn)品,為滿足戰(zhàn)備需求,在交付客戶后有很長時間處于貯存狀態(tài)。無人機貯存環(huán)境監(jiān)測系統(tǒng)可以對無人機貯存環(huán)境進行實時監(jiān)測和遠程調(diào)控,確保無人機貯存環(huán)境始終處于健康狀態(tài),對于無人機貯存可靠性的提升具有重要的作用。無人機貯存環(huán)境監(jiān)測系統(tǒng)安全、可靠、穩(wěn)定的運行是關(guān)鍵,因此對于無人機貯存環(huán)境監(jiān)測系統(tǒng)的可靠性進行分析至關(guān)重要。
對無人機貯存環(huán)境監(jiān)測系統(tǒng)而言,可靠性分析方法層出不窮,代表性的有RBD法[1]、FMECA法[2]、FTA法[3]、蒙特卡洛方法[4]、Markov方法[5]及GO法[6]。Markov分析法將系統(tǒng)看做由多種狀態(tài)構(gòu)成,具有無后效性。Markov過程的基本假設(shè)是系統(tǒng)從一種狀態(tài)到另一種狀態(tài)的轉(zhuǎn)移概率僅與當前的系統(tǒng)狀態(tài)相關(guān),無需考慮歷史狀態(tài),即概率與實時狀態(tài)相關(guān),從而可以得到系統(tǒng)的狀態(tài)概率和轉(zhuǎn)移概率,適用于無人機貯存環(huán)境監(jiān)測系統(tǒng)的可靠性分析。GO法是美國軍方專門研究的一種有效可靠性分析方法,最初是用于復雜系統(tǒng)的可靠性分析[7]。隨著GO法持續(xù)改進完善,避免了像FTA法在實際應(yīng)用中復雜建模等問題。傳統(tǒng)的GO法計算基于概率公式法,對于多信號多狀態(tài)的系統(tǒng)計算非常困難,很大程度上限制了GO法在工程上的應(yīng)用[8]。貝葉斯網(wǎng)絡(luò)(Bayesian Networks,BN)作為一種解決復雜概率的實用手段,可以與GO模型進映射互換與計算,通過把GO操作符轉(zhuǎn)換為BN節(jié)點,結(jié)合GO運算邏輯給出BN節(jié)點的條件概率,運用Bayesian軟件對GO法進行計算[9],能夠快速的得到結(jié)果,為GO法在工程上的應(yīng)用提供了便利。
無人機貯存環(huán)境監(jiān)測系統(tǒng)可靠性分析流程如下:首先對無人機貯存環(huán)境監(jiān)測系統(tǒng)結(jié)構(gòu)進行分析,利用Markov空間狀態(tài)模型對系統(tǒng)的狀態(tài)進行劃分和假設(shè),統(tǒng)計各單元的狀態(tài)參數(shù),代入Markov模型到各單元的狀態(tài)概率分布,之后根據(jù)無人機環(huán)境監(jiān)測系統(tǒng)結(jié)構(gòu)圖,建立無人機環(huán)境監(jiān)測系統(tǒng)GO圖,將GO模型的操作符轉(zhuǎn)換為貝葉斯網(wǎng)絡(luò)模型,將各單元的狀態(tài)概率代入貝葉斯網(wǎng)絡(luò)中進行運算,即可得到無人機貯存環(huán)境監(jiān)測系統(tǒng)的狀態(tài)概率分布。
無人機貯存環(huán)境監(jiān)測系統(tǒng),是為了監(jiān)測軍用無人機在戰(zhàn)備階段,能夠保證無人機產(chǎn)品在貯存期間,實時監(jiān)測無人機貯存環(huán)境的溫濕度,使無人機產(chǎn)品始終處于適宜的溫濕度范圍內(nèi),對于無人機產(chǎn)品長周期貯存的可靠性提升具有重要的現(xiàn)實意義。作為無人機產(chǎn)品貯存期間的核心環(huán)境監(jiān)測系統(tǒng),環(huán)境監(jiān)測系統(tǒng)必須滿足可靠性需求,目前針對系統(tǒng)的可靠性分析研究工作,國內(nèi)外很多學者已經(jīng)有了一定的研究[10]。無人機貯存環(huán)境監(jiān)測系統(tǒng)分為軟硬件件兩部分,其中硬件是無人機貯存環(huán)境監(jiān)測系統(tǒng)可靠性的重要保障,因此,本文假設(shè)系統(tǒng)運行過程中軟件始終處于正常狀態(tài),主要研究無人機貯存環(huán)境監(jiān)測系統(tǒng)硬件可靠性。
無人機貯存環(huán)境監(jiān)測系統(tǒng)的主要功能包括溫濕度信號采集和溫濕度信號無線傳輸,劃分到各個單元主要分為溫濕度信號采集、低壓供電、信號處理、通風控制、報警、無線傳輸單元,各個模塊以合理的邏輯關(guān)系串接在一起,形成一個穩(wěn)定的環(huán)境監(jiān)測系統(tǒng),本文設(shè)計的完整無人機貯存環(huán)境監(jiān)測系統(tǒng)的結(jié)構(gòu)示意圖如圖 1所示。
圖1 無人機貯存環(huán)境監(jiān)測系統(tǒng)結(jié)構(gòu)示意圖
本監(jiān)測系統(tǒng)是一個可以維修的監(jiān)測系統(tǒng),監(jiān)測系統(tǒng)在運行過程中,硬件故障會偶然出現(xiàn),比如溫濕度傳感器、電源和風扇等會出現(xiàn)故障,導致監(jiān)測系統(tǒng)不能完成所需功能,此時,需要維修人員對系統(tǒng)進行維修,通過更換器件等手段修復系統(tǒng),經(jīng)過修復可使系統(tǒng)恢復到正常的工作狀態(tài)。
監(jiān)測系統(tǒng)硬件失效的主要原因是硬件的元器件損壞所致,硬件失效的機理主要表現(xiàn)在元器件受到各種環(huán)境應(yīng)力的作用下而發(fā)生失效。當元器件受到的環(huán)境應(yīng)力大于器件本身可承受的極限耐力值時,元器件將發(fā)生故障,引起整個系統(tǒng)失效。
硬件發(fā)生故障時,根據(jù)不同的故障時間,可分為永久性故障和暫時性故障[11]。永久故障模式是由于元器件性能退化至器件失效,不在能完成規(guī)定的功能,只能進行維修或更換器件才能繼續(xù)工作。永久性故障按范圍又可分為全局故障和局部故障,全局故障會導致系統(tǒng)或子系統(tǒng)功能失效,而局部故障若得到及時修復,則硬件可以繼續(xù)正常工作,若未得到修復,則硬件可能會失效,系統(tǒng)降級工作。暫時性故障是指由于突然性內(nèi)外部環(huán)境因素干擾引發(fā)的,如電磁干擾、噪聲干擾等,這種故障很短時間可自我恢復,不需要維修。
對可維修的監(jiān)測系統(tǒng)進行Markov模型分析之前,首先對無人機環(huán)境監(jiān)測系統(tǒng)各單元的狀態(tài)進行劃分,之后運用Markov狀態(tài)空間模型,將統(tǒng)計好的各單元的狀態(tài)參數(shù)代入Markov模型中,得到每一單元的狀態(tài)概率分布。
無人機貯存環(huán)境監(jiān)測系統(tǒng)是一種可修復系統(tǒng),利用Markov過程能更好的反映監(jiān)測系統(tǒng)各單元的運行狀態(tài),通過對無人機貯存環(huán)境監(jiān)測系統(tǒng)各單元的運行狀態(tài)進行分析,我們將其劃分為三個狀態(tài):
1)單元可以正常運行,記為狀態(tài)3,既監(jiān)測系統(tǒng)單元處于正常運行狀態(tài)。
2)單元中某個器件失效或不能按要求完成所設(shè)功能,記為狀態(tài)2。此狀態(tài)下,系統(tǒng)的單元降級工作(為簡化模型,假設(shè)僅有一種降級狀態(tài)),此狀態(tài)下,器件若是及時維修,則可以回到狀態(tài)3,若未得到及時維修,則單元可能會轉(zhuǎn)移為失效模式。
3)無人機貯存環(huán)境監(jiān)測系統(tǒng)單元處于失效狀態(tài),記為狀態(tài)1。此時,監(jiān)測系統(tǒng)的單元不能正常工作。
4)設(shè)無人機貯存環(huán)境監(jiān)測系統(tǒng)單元發(fā)生故障的概率為31λ,,即系統(tǒng)由狀態(tài)3進入狀態(tài)1的狀態(tài)轉(zhuǎn)移率為λ3,1;設(shè)系統(tǒng)單元發(fā)生故障后的修復率為μ1,3,即系統(tǒng)由狀態(tài)3回到狀態(tài)1的狀態(tài)轉(zhuǎn)移率為13μ,。
5)設(shè)系統(tǒng)的單元由正常狀態(tài)轉(zhuǎn)為降級工作的概率為λ3,2,即單元由狀態(tài)3進入狀態(tài)2的狀態(tài)轉(zhuǎn)移率為λ3,2時。如被定期檢修發(fā)現(xiàn),可被修復回到狀態(tài)3,設(shè)由狀態(tài)2轉(zhuǎn)移到狀態(tài)3的轉(zhuǎn)移率為 23μ,。若檢修未發(fā)現(xiàn),則單元狀態(tài)進入狀態(tài)1,設(shè)狀態(tài)2轉(zhuǎn)移到狀態(tài)1的轉(zhuǎn)移率分別為21λ,。
6)假設(shè)單元維修時,每次維修均可恢復至正常狀態(tài),不考慮從狀態(tài)1維修至狀態(tài)2的情況。
7)假設(shè)監(jiān)測系統(tǒng)運行過程中軟件不發(fā)生失效,只有硬件發(fā)生失效。
8)假設(shè)系統(tǒng)各單元的失效率和修復率是已知常數(shù),對應(yīng)的可靠度和維修度服從指數(shù)分布。
9)假設(shè)各個單元之間相互串聯(lián),各單元之間不會相互影響。
從假設(shè)條件知,各單元在一定的條件下,雖然存在著一定形式的故障,但依然能繼續(xù)工作。此時各單元雖然能繼續(xù)完善基本功能,但其運作水平有所下降,各單元降級工作。無人機貯存環(huán)境監(jiān)測系統(tǒng)共分為六個不同的單元,因此我們對不同單元降級工作的條件進行劃分。
1)溫濕度采集單元:當收集的溫濕度數(shù)據(jù)與實際環(huán)境的數(shù)據(jù)值偏差溫度為1~2 ℃,濕度為5~8 %,兩種數(shù)據(jù)有一種處于以上范圍區(qū)間,則認為溫濕度采集單元降級工作,低于以上范圍為正常狀態(tài),超出以上范圍為失效狀態(tài)。
2)低壓供電單元:當額定輸出電壓超出正常額定電壓的10~20 %的情況,則認為低壓供電系統(tǒng)降級工作。低于10 %為正常狀態(tài),超出20 %為失效狀態(tài)。
3)信號處理單元:信號處理單元主要功能是溫濕度數(shù)據(jù)信號從ZigBee終端向協(xié)調(diào)器發(fā)送數(shù)據(jù),通常以丟包率來直觀的描述傳輸過程的可靠性。當數(shù)據(jù)丟包率處于5~8 %范圍之內(nèi)時,認為無線傳輸單元降級工作,低于5 %為正常狀態(tài),超出8 %為失效狀態(tài)。
4)報警單元:報警單元仍然以溫濕度范圍來進行劃分,正常的報警閾值為:溫度15~25 ℃,濕度為40~70 %。當溫度在14~26 ℃,濕度為35~75 %范圍內(nèi)報警時認為報警單元正常工作;當溫濕度在13~14 ℃或27~28 ℃、濕度在30~35 %或75~80 %范圍內(nèi)才進行報警時,認為報警單元降級工作;其它情況報警為失效狀態(tài)。
5)通風控制單元:當溫濕度超出閾值,給到溫濕度控制設(shè)備信號后,若報警單元在1 min內(nèi)啟動,則認為通風控制單元正常工作,若報警單元在1~5 min內(nèi)啟動,則認為該單元降級工作,超出5 min視為失效。
6)無線傳輸單元:本單元同樣以數(shù)據(jù)丟包率來描述傳輸過程的可靠性,當數(shù)據(jù)丟包率處于5~8 %范圍之內(nèi)時,認為無線傳輸單元降級工作,低于5 %為正常狀態(tài),超出8 %為失效狀態(tài)。
Markov過程于1907年由俄國科學家和數(shù)學家A.A.Markov提出[12],數(shù)學定義為:設(shè) {X(t),t∈T}為隨機過程,若對任意正整數(shù)n及t1<t2<···<tn有:
則稱 {X(t),t∈T}為馬爾科夫過程。該公式表明X(t1) ,...,X(tn-1)的條件概率相等,Markov具有“無記憶性”,即tn時刻的隨機變量的概率值與tn-1時刻的取值有關(guān),與tn-1前的歷史狀態(tài)無關(guān)。
實際監(jiān)測系統(tǒng)過程分析中,通常關(guān)注具有離散狀態(tài)空間及連續(xù)時間參數(shù)的齊次Markov過程。所謂齊次是指轉(zhuǎn)移概率pij( Δt)僅與 Δt有關(guān),與t無關(guān),即:
當tΔ無限小時,轉(zhuǎn)移概率為:
對于n個空間狀態(tài)的系統(tǒng),轉(zhuǎn)移概率ijp可以寫成一下空間矩陣:
P為轉(zhuǎn)移概率矩陣,其數(shù)據(jù)表達式如下所示:
設(shè)T=P-I,則狀態(tài)轉(zhuǎn)移矩陣改寫為:
式中:
I—單位矩陣;
T—中矩陣每行元素相加等于0,即
Markov以狀態(tài)空間圖為基礎(chǔ),又稱狀態(tài)空間法。由上述狀態(tài)劃分和假設(shè)條件的參數(shù)設(shè)定,可以建立無人機貯存環(huán)境監(jiān)測系統(tǒng)單元的Markov狀態(tài)空間模型,如圖2所示。
圖2 無人機貯存環(huán)境監(jiān)測系統(tǒng)Markov狀態(tài)空間模型
根據(jù)無人機貯存環(huán)境監(jiān)測系統(tǒng)單元的Markov模型及其特點,建立Markov狀態(tài)空間方程,如下所示:
式中:
Pi—無人機貯存環(huán)境監(jiān)測系統(tǒng)的單元處于it時刻的狀態(tài)分布;
T—狀態(tài)轉(zhuǎn)移矩陣。
其表達式為:
駐留矩陣可以描述為:
Pi為無人機貯存環(huán)境監(jiān)測系統(tǒng)單元在it時刻的狀態(tài)分布,本文僅對Pi的穩(wěn)態(tài)解進行分析,此情況下,Markov過程收斂于穩(wěn)態(tài)值:
式中:
p1—狀態(tài)1的概率;
p2—狀態(tài)2的概率;
p3—狀態(tài)3的概率。
式(9)中,q11,q22,q33為與無人機貯存環(huán)境監(jiān)測系統(tǒng)單元有關(guān)的指數(shù)分布,也是T矩陣的對角線元素,分別為:
同理狀態(tài)轉(zhuǎn)移矩陣可改寫為:
在通過Markov模型分析得出無人機貯存環(huán)境監(jiān)測系統(tǒng)不同單元的各個狀態(tài)概率后,運用GO法來分析無人機貯存監(jiān)測系統(tǒng)的可靠性。GO法于20世紀60年代由美國Kaman科學公司首先提出,近幾十年迅速發(fā)展,廣泛應(yīng)用于各個領(lǐng)域[13]。GO法可以準確地對系統(tǒng)概率進行分析,將系統(tǒng)原理圖、流程圖直接翻譯成GO圖,GO法通過GO圖模型進行GO運算來得到系統(tǒng)的可靠性分析結(jié)果。建立GO圖模型和進行GO運算是GO法的核心,其中GO圖模型包括操作符和信號流,GO運算采用GO算法進信號流屬性的狀態(tài)概率計算。
無人機貯存環(huán)境監(jiān)測系統(tǒng)中的元器件、部件或子系統(tǒng)可統(tǒng)稱為單元,GO法用操作符來代表單元功能和單元輸入、輸出之間的邏輯關(guān)系。目前GO法有17中類型的操作符,分為邏輯和功能操作符兩大類。信號流是指系統(tǒng)單元輸入與輸出以及單元之間的關(guān)聯(lián),信號流連接GO操作符,按屬性可分為狀態(tài)值和狀態(tài)概率。
由于六個單元分為三種狀態(tài),假設(shè)各單元相互串聯(lián),因此需要對監(jiān)測系統(tǒng)的狀態(tài)進行重新定義。若六個單元均處于狀態(tài)3,即正常狀態(tài),則系統(tǒng)處于正常工作狀態(tài),記為狀態(tài)3;若六個單元中至少有一個單元處于狀態(tài)2,且各單元均未處于狀態(tài)1,則系統(tǒng)處于降級工作狀態(tài);記為狀態(tài)2;若六個單元中至少有一個單元處于狀態(tài)1,則系統(tǒng)處于失效工作狀態(tài);記為狀態(tài)1。
本文使用的操作符有第1、5、10類適用于多狀態(tài)系統(tǒng)的操作符。無人機貯存環(huán)境監(jiān)測系統(tǒng)通過Markov模型將系統(tǒng)不同單元劃分為三種狀態(tài),通過計算得出各個狀態(tài)的概率分布,最后將這些單元的可靠性概率分布作為輸入數(shù)據(jù)代入GO圖進行GO計算。
根據(jù)無人機貯存環(huán)境監(jiān)測系統(tǒng)中各單元的功能和GO法各類操作符的特點,本文將系統(tǒng)的各模塊與GO法操作符相對應(yīng)分為三類,分別是:第1類操作符,包括信號處理單元、無線傳輸單元;第5類操作符,包括低壓電源單元、信號采集單元、報警單元;第10類操作符,表示各單元之間的邏輯關(guān)系。最后,將無人機貯存環(huán)境監(jiān)測系統(tǒng)原理圖轉(zhuǎn)換為GO圖,如圖 3所示。無人機貯存環(huán)境監(jiān)測系統(tǒng)各單元與GO圖中操作符的對應(yīng)關(guān)系見表 1。
圖3 無人機貯存環(huán)境監(jiān)測系統(tǒng)GO圖
表1 無人機貯存環(huán)境監(jiān)測系統(tǒng)操作符
本節(jié)首先定義操作符到貝葉斯網(wǎng)絡(luò)(BN)的映射規(guī)則,之后給出本監(jiān)測系統(tǒng)不同操作符的映射過程,最后基于無人機貯存環(huán)境監(jiān)測系統(tǒng)GO圖映射出貝葉斯網(wǎng)絡(luò)。
從操作符到貝葉斯網(wǎng)絡(luò)映射規(guī)則如下:
1)將操作符(非邏輯門)及輸入信號流映射為BN的根節(jié)點;
2)將所有路的輸出信號流(不含第5類操作符)映射為BN節(jié)點,與步驟(1)建立父子關(guān)系;
3)根據(jù)操作符的狀態(tài)概率來確定根節(jié)點的先驗概率;
4)根據(jù)操作符運算邏輯來確定輸出信號流對應(yīng)的BN子節(jié)點的條件概率表(Conditional Probability Table, CPT)。
GO操作符輸出信號的狀態(tài)是由輸入信號和其自身狀態(tài)通過GO運算得出的,根據(jù)不同的操作符邏輯建立不同的CPT,操作符輸入信號、輸出信號狀態(tài)及其自身關(guān)系以狀態(tài)概率組合表的形式呈現(xiàn)。
1)第1類操作符
第1類操作符是最常用的功能操作符,本文對第一類操作符根據(jù)Markov過程,將成功狀態(tài)劃分為兩種狀態(tài)2、3,故障狀態(tài)記為1。依據(jù)映射規(guī)則,其先驗概率及CPT如圖 4所示。
圖4 第1類操作符及對應(yīng)貝葉斯網(wǎng)絡(luò)
2)第5類操作符
第5類操作符為最常用的輸入操作符。本文第5類操作符分為三種狀態(tài)(1-3)。依據(jù)映射規(guī)則,其先驗概率及CPT如圖 5所示。
圖5 第5類操作符及對應(yīng)貝葉斯網(wǎng)絡(luò)
3)第10類操作符
第10類操作符是與門邏輯,該操作符有多路輸入、單路輸出信號,信號均為多狀態(tài)。圖 6中模擬了兩路輸入、單路輸出信號的邏輯單元,輸入、輸出信號均含三種狀態(tài)(1-3)。依據(jù)映射規(guī)則,其先驗概率及CPT如圖 6所示。
圖6 第10類操作符及對應(yīng)貝葉斯網(wǎng)絡(luò)
上一節(jié)給出了工程中常用的三種不同的操作符對應(yīng)的BN模型,本節(jié)給出一個完整系統(tǒng)的GO圖模型轉(zhuǎn)換為BN模型,進而計算整個監(jiān)測系統(tǒng)的狀態(tài)概率,GO圖模型映射流程如圖 7所示。
圖7 GO模型的BN轉(zhuǎn)換算法流程
步驟一:按編號i順序遍歷GO圖的信號流,將訪問到的信號流i映射到BN節(jié)點iS,訪問信號流i的前驅(qū)操作iQ,并判斷iQ操作符的類型。
1)若iO為第5類操作符,則將其狀態(tài)概率更新至BN節(jié)點iS上;
2)若iO為第10類操作符,將iO的輸入信號對應(yīng)的BN節(jié)點與節(jié)點iS建立父子關(guān)系,根據(jù)iO的狀態(tài)運算邏輯建立節(jié)點iS的CPT;
3)若iO為第1類操作符,將iO映射出一個新的BN節(jié)點iC,更新CPT,將iC和iO的輸入信號對應(yīng)的BN節(jié)點與iS節(jié)點建立父子關(guān)系,跟據(jù)iO的狀態(tài)概率建立節(jié)點iS的CPT。
步驟二:判斷i是否等于N,若不是N,則訪問下一個信號流;若為N則流程結(jié)束,完成GO模型到BN模型的映射。
本文為確保無人機貯存環(huán)境監(jiān)測系統(tǒng)可以安全可靠運行,選取了Markov空間狀態(tài)模型和GO法相結(jié)合的方式,結(jié)合貝葉斯網(wǎng)絡(luò)模型,進行無人機貯存環(huán)境監(jiān)測系統(tǒng)的可靠性分析。首先將無人機貯存環(huán)境監(jiān)測系統(tǒng)劃分為六個不同的單元,每個單元分為三種狀態(tài),針對無人機系統(tǒng)硬件的失效模式,對各單元的狀態(tài)進行劃分和假設(shè),運用Markov空間狀態(tài)模型分析得出各個單元的狀態(tài)概率分布,之后構(gòu)建的GO圖模型,為方便運算,將GO圖模型映射到貝葉斯網(wǎng)絡(luò)模型。運用以上方法,可以得出無人機貯存環(huán)境監(jiān)測系統(tǒng)各單元的狀態(tài)概率,結(jié)合貝葉斯網(wǎng)絡(luò)手段,解決了GO法在實際工程中計算復雜的難題,為環(huán)境監(jiān)測系統(tǒng)的維修和設(shè)計改進提供支持。