李 瑭,王志生,楊 洋,王紹山
(北京跟蹤與通信技術(shù)研究所 北京 100094)
航天測(cè)控系統(tǒng)是對(duì)航天器飛行進(jìn)行跟蹤測(cè)量、對(duì)工作狀態(tài)進(jìn)行監(jiān)視與控制的技術(shù)系統(tǒng)[1],是天地聯(lián)系的唯一手段。在載人航天任務(wù)中,系統(tǒng)還提供天地話音、圖像和應(yīng)用數(shù)據(jù)傳輸?shù)裙δ?,被稱為測(cè)控通信系統(tǒng)。因此,在航天任務(wù)中,測(cè)控系統(tǒng)的可靠運(yùn)轉(zhuǎn)是航天器正常運(yùn)行和航天員安全的重要保障,對(duì)系統(tǒng)可靠性的定量分析是實(shí)現(xiàn)系統(tǒng)最優(yōu)化設(shè)計(jì)的重要依據(jù),尤其是在航天器和航天員長(zhǎng)期在軌工作階段,可靠性定量化分析結(jié)果可直接指導(dǎo)測(cè)控通信資源配置。
航天測(cè)控系統(tǒng)本質(zhì)上屬于多階段任務(wù)系統(tǒng)PMS[2]。從上世紀(jì)以來(lái),國(guó)內(nèi)外學(xué)者對(duì)PMS 提出了經(jīng)典的可靠性求解算法[3-6],但是,關(guān)于航天測(cè)控系統(tǒng)的可靠性研究的相關(guān)成果較少,現(xiàn)有研究成果主要是基于經(jīng)典的可靠性計(jì)算理論進(jìn)行的。
Jeff B.Berried 指出了研究測(cè)控網(wǎng)可靠性的必要性,以及單元可靠性對(duì)系統(tǒng)可靠性的影響[7],但并未對(duì)可靠性評(píng)價(jià)方法進(jìn)行論述。南加州噴氣推進(jìn)實(shí)驗(yàn)室使用可靠性框圖模型和仿真方法,建立了美國(guó)國(guó)家航空航天局的SIM(Space Interferometry Mission)任務(wù)的可靠模型[8]。Erdem Demircioglu 等對(duì)航天測(cè)控系統(tǒng)的可靠性進(jìn)行了分析[9],仿真建立了航天測(cè)控系統(tǒng)可靠性指標(biāo)曲線,用于優(yōu)化系統(tǒng)結(jié)構(gòu)。文獻(xiàn)[10]介紹了串、并、混聯(lián)、備份等經(jīng)典的系統(tǒng)可靠性分析技術(shù)。高薇等運(yùn)用故障樹分析方法對(duì)航天測(cè)控系統(tǒng)中的應(yīng)急通信網(wǎng)絡(luò)系統(tǒng)進(jìn)行了基本可靠性計(jì)算[11]。馬順南等深入研究了測(cè)控系統(tǒng)的可靠性計(jì)算框架[12],按照不同的測(cè)控業(yè)務(wù)建立可靠性原理框圖,通過(guò)Bayes 模型計(jì)算整個(gè)系統(tǒng)的可靠性。
分析表明,上述方法均為近似描述航天測(cè)控系統(tǒng),未全面反映系統(tǒng)的特點(diǎn)。因此,可靠性定量化準(zhǔn)確計(jì)算成為長(zhǎng)期以來(lái)困擾測(cè)控系統(tǒng)的難題。本文提出了基于Markov 模型的航天測(cè)控系統(tǒng)可靠性計(jì)算方法,借鑒Markov 鏈描述航天測(cè)控系統(tǒng)可靠性階段內(nèi)狀態(tài)轉(zhuǎn)移過(guò)程;綜合利用全概率思想進(jìn)行階段間狀態(tài)映射,體現(xiàn)階段間的依賴性;最后通過(guò)與蒙特卡洛仿真結(jié)果的比對(duì),驗(yàn)證Markov 方法的準(zhǔn)確性。
航天測(cè)控系統(tǒng)由多個(gè)任務(wù)中心、分布在國(guó)內(nèi)外的地面測(cè)控站、航行在海上的測(cè)量船、接近全球覆蓋的中繼衛(wèi)星系統(tǒng)以及地面通信網(wǎng)組成。在可靠性方面,航天測(cè)控系統(tǒng)的特點(diǎn)包括動(dòng)態(tài)性、復(fù)雜性、可維修性、階段間相關(guān)性等。
①動(dòng)態(tài)性:中繼衛(wèi)星系統(tǒng)、地面測(cè)控站分布于不同的地理位置,各測(cè)控資源為航天器提供服務(wù)的時(shí)間有所不同,因此不同時(shí)間段內(nèi)系統(tǒng)的參試結(jié)構(gòu)和組成不同,呈現(xiàn)動(dòng)態(tài)變化。
② 復(fù)雜性:系統(tǒng)執(zhí)行任務(wù)的環(huán)節(jié)包括任務(wù)中心、通信網(wǎng)、測(cè)控設(shè)備等,測(cè)控設(shè)備可提供多種的服務(wù),不同的服務(wù)之間使用的通信方式、涉及的任務(wù)中心不完全相同,因此系統(tǒng)的邏輯結(jié)構(gòu)并非簡(jiǎn)單的串聯(lián)、并聯(lián)等,呈現(xiàn)復(fù)雜性。
③可維修性:測(cè)控設(shè)備、通信設(shè)備、任務(wù)中心均設(shè)計(jì)為可修復(fù)產(chǎn)品,出現(xiàn)故障后可在一定時(shí)間內(nèi)修復(fù)。
④ 階段間相關(guān)性:執(zhí)行航天任務(wù)時(shí),存在同一設(shè)備參與多個(gè)任務(wù)階段(或圈次)的情況,各時(shí)段間并非統(tǒng)計(jì)獨(dú)立的關(guān)系,存在相關(guān)性和依賴性。
在可靠性計(jì)算過(guò)程中,必須要真實(shí)反映上述特點(diǎn),計(jì)算的結(jié)果才具有較高的可信度。通過(guò)分析現(xiàn)有經(jīng)典可靠性計(jì)算模型的適用性,串、并聯(lián)等方法均不適用于測(cè)控系統(tǒng)工作場(chǎng)景。
航天測(cè)控系統(tǒng)本質(zhì)上是一個(gè)具有多個(gè)任務(wù)階段的動(dòng)態(tài)結(jié)構(gòu)系統(tǒng),系統(tǒng)由多個(gè)單元組成,在執(zhí)行不同階段的任務(wù)時(shí),參試的單元不盡相同,各單元間的邏輯結(jié)構(gòu)也有所不同,同時(shí),各階段間還存在著一定的相關(guān)性。
基于Markov 模型和全概率思想的航天測(cè)控系統(tǒng)可靠性計(jì)算的主要思路是,按系統(tǒng)參試結(jié)構(gòu)是否變化分別處理,參試結(jié)構(gòu)固定時(shí)以Markov 思想進(jìn)行狀態(tài)轉(zhuǎn)移,在每一個(gè)任務(wù)階段分別建立各自的Markov模型,利用狀態(tài)轉(zhuǎn)移矩陣表示各參試單元在正常與故障之間的變化;當(dāng)系統(tǒng)結(jié)構(gòu)變化時(shí)以全概率思想將前一階段的最終狀態(tài)映射為下階段的初態(tài)。依次對(duì)各階段的任務(wù)可靠性進(jìn)行遞推求解,即得到全過(guò)程的任務(wù)可靠性。
設(shè)某一階段有m個(gè)單元參加任務(wù),每個(gè)單元有故障和正常兩種狀態(tài),建立這些單元的狀態(tài)向量為A={A1,A2,…Ai…,Am},其中,Ai=1,0分別表示第i個(gè)單元正?;蚬收稀個(gè)單元參加任務(wù)時(shí),微觀狀態(tài)空間S共有個(gè)狀態(tài)。記在時(shí)刻t系統(tǒng)的狀態(tài)向量為
設(shè)起始時(shí)刻為0,則根據(jù)可靠性模型,可以利用公式(1)確定狀態(tài)轉(zhuǎn)移概率關(guān)系[13,14]:
其中,P(0)為系統(tǒng)處于X(0)的概率向量。給定第k個(gè)任務(wù)階段系統(tǒng)的結(jié)構(gòu)函數(shù)為Φ(A),則系統(tǒng)的失效狀態(tài)集為:
設(shè)系統(tǒng)在階段初處于各正常狀態(tài)的概率向量為 [p1,p2...pn],任務(wù)時(shí)間為t,則階段末的任務(wù)可靠度為:
航天測(cè)控系統(tǒng)中,各任務(wù)階段間密切相關(guān),且每個(gè)階段參試單元數(shù)量不盡相同,因此,不同階段間的系統(tǒng)狀態(tài)一般不能直接映射,而應(yīng)將后一階段各狀態(tài)的概率初值采用前階段各狀態(tài)概率的全概率函數(shù)表示。需注意的是,因某一階段的吸收態(tài)不會(huì)對(duì)整個(gè)任務(wù)可靠性產(chǎn)生貢獻(xiàn),狀態(tài)映射時(shí)不對(duì)前一階段末的吸收狀態(tài)進(jìn)行映射。
由于各階段間是無(wú)縫銜接的,所以在階段轉(zhuǎn)移期間可以認(rèn)為共用單元的狀態(tài)不會(huì)發(fā)生變化。因此,兩個(gè)連續(xù)任務(wù)弧段間狀態(tài)映射的基本規(guī)則為:當(dāng)前弧段中狀態(tài)的初始概率值為前一弧段末相同狀態(tài)對(duì)應(yīng)的概率值。由于不同階段的參試單元并不相同,給階段間狀態(tài)匹配增加了復(fù)雜度。
系統(tǒng)狀態(tài)可以用一個(gè)二進(jìn)制字符串M=s1s2…表示,其中si對(duì)應(yīng)某個(gè)參試單元ui的狀態(tài)。令表示階段k-1(arck-1)中的第i種狀態(tài),表示階段k(arck)中的第j種狀態(tài)。下面分三種情況進(jìn)行討論。
情況一:當(dāng)前任務(wù)弧段有新的參試單元加入。
若arck中有新的參試單元加入,由于新單元初始狀態(tài)為正常,因此包含新單元為“0”的狀態(tài)在arck的初始概率為0;對(duì)于包含新單元為“1”的狀態(tài)二進(jìn)制串中新單元的對(duì)應(yīng)位剔除,然后按照上述基本規(guī)則將狀態(tài),得到arck的初始狀態(tài)概率向量。舉例,設(shè)arck-1中的參試單元為u1、u2,arck中的參試單元為u1、u2和新單元u3,則其狀態(tài)映射過(guò)程如圖1 所示。
圖1 情況一階段間狀態(tài)映射過(guò)程Fig.1 Process of state mapping between stages for case 1
情況二:前一任務(wù)弧段的某些參試單元在以后的任務(wù)弧段中都不再執(zhí)行任務(wù)。
圖2 情況二階段間狀態(tài)映射過(guò)程Fig.2 Process of state mapping between stages for case 2
情況三:前一階段的單元在當(dāng)前階段不參試,但會(huì)在后續(xù)階段中再次使用。這種情況下,該單元雖不承擔(dān)任務(wù)但應(yīng)保持運(yùn)行狀態(tài),可認(rèn)為該單元在arck中進(jìn)行正常的狀態(tài)轉(zhuǎn)移,但不影響任務(wù)成敗。因此,arck中的狀態(tài)是包含了對(duì)這些單元的描述。舉例,設(shè)arck-1中的參試單元為u1、u2和u3,arck中的單元為u1,單元u2和u3在arck中暫不參試,但在以后的任務(wù)弧段中還會(huì)繼續(xù)使用,則其狀態(tài)映射過(guò)程如圖3 所示。
圖3 情況三階段間狀態(tài)映射過(guò)程Fig.3 Process of state mapping between stages for case 3
基于Markov 模型的系統(tǒng)可靠性計(jì)算流程如圖4 所示。
圖4 基于Markov 模型的可靠性計(jì)算流程Fig.4 Flow chart of Markov-based reliability analysis
為了驗(yàn)證基于Markov 模型的可靠性計(jì)算方法的正確性和有效性,本章將使用該算法和蒙特卡洛仿真法針對(duì)同一場(chǎng)景進(jìn)行可靠性計(jì)算,比較二者結(jié)果的一致性。蒙特卡洛仿真法的思路是,直接仿真測(cè)控系統(tǒng)執(zhí)行任務(wù)的過(guò)程,根據(jù)各單元的可靠性指標(biāo)隨機(jī)仿真其發(fā)生故障和修復(fù)故障的時(shí)間,據(jù)此判定任務(wù)的成敗,通過(guò)大樣本次數(shù)仿真統(tǒng)計(jì)得到系統(tǒng)可靠性的近似值。這里的仿真次數(shù)設(shè)置為一千萬(wàn)次,可以證明此時(shí)與精確解的近似精度優(yōu)于10-4。
下面以某航天任務(wù)關(guān)鍵飛行段落為例進(jìn)行可靠性計(jì)算。測(cè)控系統(tǒng)需提供軌道測(cè)量、遙控與數(shù)據(jù)注入、遙測(cè)接收等業(yè)務(wù),上述任務(wù)由兩個(gè)控制中心、兩個(gè)測(cè)控站及地面通信網(wǎng)完成,如圖5 所示。
圖5 測(cè)控系統(tǒng)布局示意圖Fig.5 Illustration of TT&C system layout
首先,按照本文第2 節(jié)的方法建立任務(wù)可靠性模型。第一層次模型按照參加任務(wù)的組成單元是否發(fā)生變化切分為三個(gè)時(shí)段,每個(gè)時(shí)段相同的部分為兩個(gè)任務(wù)中心和地面通信網(wǎng),不同的部分為參試的測(cè)控站,t1時(shí)段為測(cè)站一,t2時(shí)段為測(cè)站一和測(cè)站二,t3時(shí)段為測(cè)站二,如圖6 所示。
圖6 按時(shí)段構(gòu)建的可靠性模型Fig.6 Reliability model of TT&C system for time stages
以t1時(shí)間段為例,給出軌道測(cè)量、遙測(cè)接收、遙控及數(shù)據(jù)注入任務(wù)的可靠性模型。
軌道測(cè)量任務(wù)由任務(wù)中心利用測(cè)站一的外測(cè)數(shù)據(jù)計(jì)算完成。其中,兩個(gè)任務(wù)中心均具備計(jì)算能力,構(gòu)成并聯(lián)關(guān)系;地面通信網(wǎng)由雙路由組成,構(gòu)成并聯(lián)關(guān)系。軌道測(cè)量的可靠性模型如圖7 所示。
圖7 軌道測(cè)量可靠性模型Fig.7 Reliability model of orbit measurement
遙測(cè)接收任務(wù)由任務(wù)中心處理測(cè)站一接收的遙測(cè)數(shù)據(jù)完成。其中,僅一個(gè)任務(wù)中心具備遙測(cè)處理能力;測(cè)站一具有遙測(cè)和數(shù)傳接收能力,數(shù)傳數(shù)據(jù)中也包含遙測(cè)數(shù)據(jù),遙測(cè)功能和數(shù)傳功能構(gòu)成并聯(lián)關(guān)系;遙測(cè)數(shù)據(jù)利用雙路由向任務(wù)中心發(fā)送,數(shù)傳數(shù)據(jù)僅從單路由向任務(wù)中心發(fā)送。遙測(cè)接收的可靠性模型如圖8 所示。
圖8 遙測(cè)接收可靠性模型Fig.8 Reliability model of telemetry receiving
遙控及數(shù)據(jù)注入任務(wù)由任務(wù)中心通過(guò)測(cè)站一向航天器發(fā)送上行數(shù)據(jù)完成。其中,僅一個(gè)任務(wù)中心具備發(fā)送上行數(shù)據(jù)的能力;地面通信網(wǎng)由雙路由組成,構(gòu)成并聯(lián)關(guān)系。遙控及數(shù)據(jù)注入可靠性模型如圖9所示。
圖9 遙控及數(shù)據(jù)注入可靠性模型Fig.9 Reliability model of remote control
t2時(shí)段、t3時(shí)段內(nèi)各測(cè)控任務(wù)可靠性模型可參考t1時(shí)段,這里不再贅述。
表1 給出各單元的可靠性參數(shù);t1、t2、t3三個(gè)時(shí)段的時(shí)長(zhǎng)分別是1.5 min、1 min、3 min,對(duì)于可靠性模型中的各參試單元,不妨設(shè)故障率、修復(fù)率服從指數(shù)分布。
表1 單元可靠性參數(shù)Table 1 Reliability of equipment
在已知輸入條件和可靠性模型的基礎(chǔ)上,利用Markov 方法和蒙特卡洛仿真法[15]分別計(jì)算可靠性,最終的可靠性計(jì)算結(jié)果見表2,兩種不同的方法得到結(jié)果的一致性較好。由于仿真次數(shù)足夠多,仿真結(jié)果偏差可基本忽略,因此兩種方法計(jì)算結(jié)果的吻合證明了Markov 方法的有效性。需要說(shuō)明的是,蒙特卡洛仿真法的計(jì)算精確度取決于仿真次數(shù),因此,為獲取較為準(zhǔn)確的計(jì)算結(jié)果需要較大的仿真工作量,對(duì)應(yīng)的計(jì)算時(shí)間較長(zhǎng);相比之下,Markov 方法屬于解析算法,計(jì)算量要小得多,在計(jì)算時(shí)間方面具有一定優(yōu)勢(shì)。
表2 可靠性計(jì)算結(jié)果Table 2 Result of reliability
本文分析了航天測(cè)控系統(tǒng)的特點(diǎn),建立了系統(tǒng)可靠性模型,提出了基于Markov 模型的精確求解可靠性的理論方法,能夠針對(duì)測(cè)控通信系統(tǒng)執(zhí)行任務(wù)的實(shí)際情況進(jìn)行較為準(zhǔn)確的定量化計(jì)算。該方法的應(yīng)用前景主要有兩個(gè)方向:一是直接用于當(dāng)前任務(wù)狀態(tài)下系統(tǒng)可靠性評(píng)價(jià),指導(dǎo)系統(tǒng)方案設(shè)計(jì)和資源合理調(diào)配,實(shí)現(xiàn)資源效益最大化;二是用于指導(dǎo)系統(tǒng)可靠性指標(biāo)分配,消除系統(tǒng)可靠性短板,為后續(xù)任務(wù)系統(tǒng)建設(shè)方案論證提供重要參考。