仇存凱,張曉慧,樊 弢,吳鵬飛,朱紫涵
(1.上海航天控制技術(shù)研究所·上?!?01109;2.上海慣性工程技術(shù)研究中心·上?!?01109)
1553B通信具有可靠性高、實(shí)時(shí)性強(qiáng)、易于擴(kuò)展等優(yōu)點(diǎn),現(xiàn)已廣泛應(yīng)用于航天數(shù)據(jù)傳輸系統(tǒng)。但是,由于太空中各種不穩(wěn)定因素的存在,如單粒子翻轉(zhuǎn)等,若不對(duì)空間站推進(jìn)1553B通信系統(tǒng)進(jìn)行冗余設(shè)計(jì),系統(tǒng)存在單點(diǎn)失效的可能,導(dǎo)致推進(jìn)系統(tǒng)與外界通信異常,進(jìn)而影響空間站正常運(yùn)行。為避免單點(diǎn)失效對(duì)空間站造成的不良影響,利用冗余技術(shù)安全可靠、容錯(cuò)性能好的特點(diǎn),對(duì)1553B通信系統(tǒng)中重要的電子元器件進(jìn)行雙余度冗余設(shè)計(jì),以保證系統(tǒng)可靠性。
目前,可靠性分析研究方法主要包含威布爾模型法、貝葉斯網(wǎng)絡(luò)法以及馬爾可夫鏈法等。其中,威布爾模型法基于系統(tǒng)樣本數(shù)據(jù)進(jìn)行分析計(jì)算;貝葉斯網(wǎng)絡(luò)法側(cè)重于事件靜態(tài)概率分析;馬爾可夫鏈法則根據(jù)系統(tǒng)狀態(tài)轉(zhuǎn)移關(guān)系分析其動(dòng)態(tài)可靠性。鑒于空間站推進(jìn)1553B通信系統(tǒng)屬于單件小批量產(chǎn)品,本文采用馬爾可夫鏈法建立可靠性模型,分析1553B通信系統(tǒng)的動(dòng)態(tài)可靠性,并引入可靠度以及平均無故障時(shí)間作為可靠性定量指標(biāo)。
由于本文設(shè)計(jì)方案對(duì)空間站推進(jìn)1553B通信系統(tǒng)中包含數(shù)據(jù)隔離芯片在內(nèi)的遠(yuǎn)程終端及其處理器均進(jìn)行了雙余度冗余,系統(tǒng)狀態(tài)組合隨之增加,這將導(dǎo)致系統(tǒng)可靠度求解過程變得復(fù)雜。因此,本文將1553B通信系統(tǒng)故障樹中的動(dòng)態(tài)子樹與靜態(tài)子樹進(jìn)行分離,采用馬爾可夫鏈求解動(dòng)態(tài)子樹,并在此基礎(chǔ)上求解整個(gè)系統(tǒng)故障樹,以簡化求解過程,提高計(jì)算效率。
定義{(),≥0}為系統(tǒng)在時(shí)刻所處狀態(tài),其取值范圍為可數(shù)狀態(tài)集合={1,2,…,},其中(屬于非零自然數(shù))為系統(tǒng)狀態(tài)總數(shù),()在集合上隨機(jī)取值。對(duì)于任意時(shí)刻(屬于自然數(shù)),有0≤<<…<<+1,若+1時(shí)刻系統(tǒng)所處狀態(tài)概率滿足式(1),則將式(1)描述的隨機(jī)取值過程稱為馬爾可夫鏈。
{(+1)=+1|()=,(-1)=-1},…,
()=}
={(+1)=+1|()=}
(1)
式中,為系統(tǒng)在時(shí)刻所處的狀態(tài),∈。
在任意≥0時(shí)刻,經(jīng)過任意Δ>0時(shí)間,若系統(tǒng)狀態(tài)轉(zhuǎn)移概率滿足式(2),則稱滿足式(2)的馬爾可夫鏈為齊次馬爾可夫鏈。
{(+Δ)=|()=}=(Δ)
(2)
式中,為系統(tǒng)在時(shí)刻處于狀態(tài)條件下在+Δ時(shí)刻處于狀態(tài)的概率;(Δ)為系統(tǒng)在任意時(shí)刻經(jīng)過一定時(shí)間增量Δ由狀態(tài)轉(zhuǎn)變成狀態(tài)的概率;,為系統(tǒng)所處狀態(tài),,∈。
齊次馬爾可夫鏈具備以下式(3)所示性質(zhì)。
(3)
基于空間站高可靠性要求,本文方案采用雙余度冗余技術(shù)對(duì)推進(jìn)1553B通信系統(tǒng)進(jìn)行冗余,以保證空間站長期穩(wěn)定地在軌運(yùn)行。
1553B通信系統(tǒng)設(shè)計(jì)架構(gòu)如圖1所示,其中數(shù)據(jù)收發(fā)裝置(遠(yuǎn)程終端和數(shù)據(jù)隔離芯片)為熱備,處理器為冷備。具體工作原理如下:上位機(jī)根據(jù)通信狀態(tài)自主選擇總線1或總線2進(jìn)行通信,選擇總線1時(shí),發(fā)出中斷1至處理器;選擇總線2時(shí),發(fā)出中斷2至處理器。當(dāng)班處理器(當(dāng)前處于熱機(jī)狀態(tài)的處理器,當(dāng)處理器1通路故障時(shí),由處理器1切換至處理器2)根據(jù)中斷置出片選(片選1對(duì)應(yīng)中斷1、片選2對(duì)應(yīng)中斷2),選通數(shù)據(jù)隔離芯片1或數(shù)據(jù)隔離芯片2,進(jìn)而控制遠(yuǎn)程終端1或遠(yuǎn)程終端2,從而實(shí)現(xiàn)與上位機(jī)之間的通信。
圖1 1553B通信系統(tǒng)架構(gòu)Fig.1 Architecture of 1553B communication system
根據(jù)1553B通信系統(tǒng)工作原理,分析可能產(chǎn)生通信系統(tǒng)故障的原因,其中可能失效的部件主要包含遠(yuǎn)程終端、數(shù)據(jù)隔離芯片以及處理器,并由此構(gòu)建圖2所示動(dòng)態(tài)故障樹。
圖2 1553B通信系統(tǒng)動(dòng)態(tài)故障樹Fig.2 Dynamic fault tree of 1553B communication system
圖2中:HSP為熱備件門;CSP為冷備件門;為頂層事件;、、、為中間事件;、、、、、為底層(基本)事件。
各事件代號(hào)表示的具體含義見表1。
表1 1553B通信系統(tǒng)故障含義Tab.1 Failure meaning of 1553B communication system
將圖2動(dòng)態(tài)故障樹分解為動(dòng)態(tài)子樹及靜態(tài)子樹,動(dòng)態(tài)子樹包含事件、事件;靜態(tài)子樹包含事件、事件以及以、為基本事件的頂層事件靜態(tài)故障樹,具體如圖3 (a)~(e)所示。其中,HSP為熱備門,CSP為冷備門。
(a) 頂層事件T靜態(tài)故障樹
(b) 事件A動(dòng)態(tài)子樹
(c) 事件D動(dòng)態(tài)子樹
(d) 事件B靜態(tài)子樹
(e) 事件C靜態(tài)子樹
由于主路/備路收發(fā)裝置由遠(yuǎn)程終端和數(shù)據(jù)隔離芯片串聯(lián)構(gòu)成,其中一個(gè)元器件失效即會(huì)導(dǎo)致整個(gè)收發(fā)裝置的失效,因此收發(fā)裝置的失效率由式(4)表示。
==+
(4)
式中,為遠(yuǎn)程終端失效率;為數(shù)據(jù)隔離芯片失效率;為主路收發(fā)裝置失效率;為備路收發(fā)裝置失效率。
假定系統(tǒng)不可維修,采用馬爾可夫鏈分別建立事件、事件可靠性分析模型,對(duì)故障樹進(jìn)行求解。其中事件馬爾可夫狀態(tài)轉(zhuǎn)移圖如圖4所示。
圖4 事件A馬爾可夫狀態(tài)轉(zhuǎn)移模型Fig.4 Markov state transition model of event A
圖4中:00定義為無故障狀態(tài),其時(shí)刻概率表示為();01定義為主路收發(fā)裝置故障狀態(tài),其時(shí)刻概率表示為();10定義為備路收發(fā)裝置故障狀態(tài),其時(shí)刻概率表示為();11定義為主備路收發(fā)裝置故障狀態(tài),其時(shí)刻概率表示為()。
根據(jù)圖4所示狀態(tài)轉(zhuǎn)移圖轉(zhuǎn)移規(guī)律,在經(jīng)過時(shí)間Δ后,事件各狀態(tài)轉(zhuǎn)移表如表2所示,表中的數(shù)據(jù)為由當(dāng)前狀態(tài)轉(zhuǎn)移至下一狀態(tài)的概率。
表2 事件A狀態(tài)轉(zhuǎn)移表Tab.2 State transition table of event A
由表2可得式(5)所示事件A狀態(tài)轉(zhuǎn)移方程組,≥0。
(5)
式中,為狀態(tài)轉(zhuǎn)移矩陣。
根據(jù)導(dǎo)數(shù)定義分別求解各狀態(tài)概率的導(dǎo)數(shù)
′()、′()、′()、′()
(6)
由上述方程組可得事件A馬爾可夫微分方程
(7)
式中,為事件狀態(tài)轉(zhuǎn)移速率矩陣;(0)、(1)、(2)、(3)分別為狀態(tài)、、、初始時(shí)刻概率。
對(duì)事件A馬爾可夫微分方程進(jìn)行拉普拉斯變換得式(8)所示方程組。
(8)
將式(7)中初始條件(0)、(1)、(2)、(3)代入以上方程組,解得
在洛陽城里,從朝陽到夕陽,平時(shí)溫暖的風(fēng),漸漸有了寒意,平時(shí)那些充滿活力的翠綠葉子,也變成了經(jīng)歷人間滄桑的枯黃葉子,以往繁華熱鬧的街道也變得冷清了,洛陽城里一切都變了。
(9)
對(duì)上述方程組進(jìn)行拉普拉斯反變換得
(10)
由式(10)可得事件A發(fā)生的概率()
()=()=1-2e-+e-2
(11)
定義收發(fā)裝置的可靠度為(),則()表示為
()=()+()+() =2e--e-2
(12)
同理求解事件D動(dòng)態(tài)子樹,繪制圖5所示事件D馬爾可夫狀態(tài)轉(zhuǎn)移模型。
圖5 事件D馬爾可夫狀態(tài)轉(zhuǎn)移模型Fig.5 Markov state transition model of event D
圖5中:00定義為無故障狀態(tài);01定義為主路收發(fā)裝置故障狀態(tài);11定義為主備路收發(fā)裝置故障狀態(tài)。
依據(jù)馬爾可夫鏈,分別計(jì)算處理器的事件D發(fā)生的概率()以及可靠度()
(13)
式中,λ為處理器失效率。
采用二元決策圖分析頂層事件T發(fā)生的概率,構(gòu)建圖6所示二元決策圖對(duì)頂層事件T靜態(tài)故障樹進(jìn)行分析求解。
圖6 頂層事件T靜態(tài)故障樹二元決策圖Fig.6 Binary decision diagram of top event T static fault tree
遍歷圖6所示二元決策圖,得出最小割集為{}、{},由此計(jì)算出頂層事件發(fā)生的概率()
=1-(1-())(1-())
=1-(2e--e-2)(e-+e-)
(14)
根據(jù)式(14)可得可靠度()
()=1-()
=(2e--e-2)(e-+e-)
(15)
為簡化計(jì)算,選取可靠性等級(jí)相同的電子元器件,令===,得
()=(1+)(2-e-2)e-3
(16)
由可靠度計(jì)算1553通信系統(tǒng)在雙余度冗余情況下的平均無故障時(shí)間
(17)
(18)
由式(18)可知,采用雙余度冗余設(shè)計(jì)方案,1553通信系統(tǒng)平均無故障時(shí)間增加1947倍。
依據(jù)1772-79,以選用可靠性等級(jí)為七級(jí)(=1×10h)的元器件為例,分別計(jì)算冗余和未冗余情況下1553通信系統(tǒng)的可靠度,并繪制可靠度隨時(shí)間變化曲線,如圖7所示。
圖7 1553B通信系統(tǒng)可靠度隨時(shí)間變化曲線Fig.7 Reliability curve of 1553B communication system over time
圖7顯示,15年(180個(gè)月)期間,未冗余情況下,1553通信系統(tǒng)的可靠度為0961866,發(fā)生故障的概率達(dá)38134;而在冗余情況下,1553通信系統(tǒng)的可靠度為0999262,發(fā)生故障的概率僅為00738,相比未冗余情況,系統(tǒng)可靠度增長389,故障概率則下降超98,極大提高了系統(tǒng)的可靠性。
1553通信系統(tǒng)是實(shí)現(xiàn)空間站推進(jìn)系統(tǒng)與外界進(jìn)行數(shù)據(jù)交換的關(guān)鍵部分,本文方案采用雙余度冗余技術(shù),對(duì)推進(jìn)1553通信系統(tǒng)各組成器件進(jìn)行冗余設(shè)計(jì),以保證系統(tǒng)可靠性。
本文通過建立1553通信系統(tǒng)故障樹,并將故障樹分解為動(dòng)態(tài)子樹與靜態(tài)子樹,分析系統(tǒng)可靠性。其中對(duì)于動(dòng)態(tài)子樹,本文引入馬爾可夫鏈建立1553通信系統(tǒng)可靠性模型,繪制系統(tǒng)狀態(tài)轉(zhuǎn)移圖,分別對(duì)系統(tǒng)中冷、熱備份模塊動(dòng)態(tài)子樹進(jìn)行可靠度計(jì)算,并在此基礎(chǔ)上采用二元決策圖求解整個(gè)系統(tǒng)故障樹可靠度。
根據(jù)本文計(jì)算結(jié)果可以得出,隨著雙余度冗余技術(shù)的應(yīng)用,1553通信系統(tǒng)平均無故障時(shí)間大幅增加,故障發(fā)生概率大幅降低,系統(tǒng)可靠性顯著改善,由此驗(yàn)證了雙余度冗余設(shè)計(jì)方案對(duì)1553通信系統(tǒng)可靠性提升的有效性。