朱海洋 胡文靜 陳浩 孫海忠(北京空間信息中繼傳輸技術(shù)研究中心)
在軌衛(wèi)星異常實(shí)時(shí)處置技術(shù)研究
朱海洋 胡文靜陳浩 孫海忠(北京空間信息中繼傳輸技術(shù)研究中心)
傳統(tǒng)的衛(wèi)星控制中心主要采用信號(hào)鏈路和軟件進(jìn)行衛(wèi)星狀態(tài)的實(shí)時(shí)診斷,但對(duì)于故障與異常的處置過(guò)程仍采用基于人工干預(yù)的方式,其處置的正確性主要通過(guò)事先制定的故障處置預(yù)案來(lái)保證。對(duì)于同時(shí)對(duì)多顆衛(wèi)星實(shí)施長(zhǎng)期管理的衛(wèi)星控制中心,由于對(duì)衛(wèi)星平臺(tái)的操作和對(duì)用戶(hù)服務(wù)交織在一起,任務(wù)種類(lèi)繁多、系統(tǒng)構(gòu)架復(fù)雜,對(duì)衛(wèi)星故障定位的準(zhǔn)確性、處置的實(shí)時(shí)性要求更高,傳統(tǒng)的人工現(xiàn)場(chǎng)處置方式難以保證處置的成功率,或者實(shí)現(xiàn)處置效果的最優(yōu)化。因此,必須研究適應(yīng)衛(wèi)星組網(wǎng)運(yùn)行模式的系統(tǒng)故障實(shí)時(shí)智能處置機(jī)制和實(shí)現(xiàn)方法,實(shí)現(xiàn)全任務(wù)過(guò)程故障識(shí)別、處置、效果評(píng)估的自動(dòng)閉環(huán)流程,對(duì)有預(yù)案的故障實(shí)現(xiàn)自動(dòng)化隔離處置,對(duì)無(wú)預(yù)案故障提供分析、判斷和決策的輔助專(zhuān)家系統(tǒng)支持。通過(guò)對(duì)故障實(shí)時(shí)處置過(guò)程的基本要素進(jìn)行分析,提出故障實(shí)時(shí)處置需要重點(diǎn)關(guān)注和解決的幾個(gè)問(wèn)題,為衛(wèi)星控制管理中心進(jìn)行故障實(shí)時(shí)處置系統(tǒng)建設(shè)提供參考。
故障實(shí)時(shí)處置流程示意圖
衛(wèi)星控制中心的故障實(shí)時(shí)處置系統(tǒng)包含的基本要素有以下5個(gè)部分:故障實(shí)時(shí)檢測(cè)、故障準(zhǔn)確診斷與定位、故障處置策略的正確生成、故障的及時(shí)處置、處置效果評(píng)估。
(1)故障實(shí)時(shí)檢測(cè)
它基于衛(wèi)星的遙測(cè)、外測(cè)數(shù)據(jù),實(shí)時(shí)分析衛(wèi)星各分系統(tǒng)運(yùn)行狀態(tài),針對(duì)衛(wèi)星載荷任務(wù)中相應(yīng)的狀態(tài)變化,甄別、監(jiān)視系統(tǒng)的運(yùn)行狀態(tài),準(zhǔn)確感知星上或地面系統(tǒng)出現(xiàn)的故障。系統(tǒng)故障的檢測(cè)應(yīng)具有高度的敏感度,盡量減少虛警、漏警發(fā)生的概率,從而確保后續(xù)操作流程的正確性。
(2)故障準(zhǔn)確診斷與定位
融合故障檢測(cè)結(jié)果和各分系統(tǒng)的狀態(tài)監(jiān)視信息,基于故障分析和建模,通過(guò)知識(shí)推理完成故障的自動(dòng)診斷、識(shí)別。由于故障發(fā)生時(shí)會(huì)在多個(gè)分系統(tǒng)產(chǎn)生外在表現(xiàn)數(shù)據(jù),因此,故障診斷、定位必須準(zhǔn)確,其置信度要高。
(3)故障處置策略的正確生成
其關(guān)鍵在于建立正確、全面的故障知識(shí)庫(kù),故障知識(shí)庫(kù)中既包括故障推理準(zhǔn)則,也包括故障處置的決策建議,對(duì)于有預(yù)案的故障,給出詳細(xì)的自動(dòng)處置流程,對(duì)于無(wú)預(yù)案的故障,提供分析、判斷和決策的輔助專(zhuān)家系統(tǒng)支持。
(4)故障的及時(shí)處置
它要求針對(duì)有預(yù)案的系統(tǒng)故障,能夠?qū)崟r(shí)檢測(cè)故障處置的條件是否具備,必要時(shí)自動(dòng)完成地面站設(shè)備、軟件和中繼衛(wèi)星的控制。在此基礎(chǔ)上,實(shí)現(xiàn)故障處置流程的自動(dòng)化。系統(tǒng)故障處置時(shí),必須處理好與正常控制流程之間的關(guān)系,對(duì)于實(shí)時(shí)性要求很高的故障處置,在處置過(guò)程中必須確保系統(tǒng)控制的優(yōu)先權(quán)。
(5)處置效果的實(shí)時(shí)、準(zhǔn)確評(píng)估
它是在故障處置過(guò)程中實(shí)時(shí)監(jiān)視實(shí)施效果,并依據(jù)一定的評(píng)估準(zhǔn)則對(duì)處置效果進(jìn)行評(píng)估,評(píng)估結(jié)果可作為是否進(jìn)行下一步處置的依據(jù)。
故障的診斷與檢測(cè)
要實(shí)現(xiàn)衛(wèi)星的實(shí)時(shí)處置,首先應(yīng)對(duì)衛(wèi)星各模塊、分系統(tǒng)的健康狀態(tài)有明確的認(rèn)識(shí),因此,故障檢測(cè)和診斷技術(shù)是實(shí)現(xiàn)衛(wèi)星實(shí)時(shí)處置的前提。
目前,國(guó)內(nèi)航天器的故障檢測(cè)是采用閾值形式進(jìn)行判讀,然后再根據(jù)閾值進(jìn)行診斷,當(dāng)部件或設(shè)備失效后直接切換到備機(jī),復(fù)雜的故障情況基本上采用地面專(zhuān)家會(huì)診方式實(shí)現(xiàn),僅是某些對(duì)平臺(tái)不具有安全性影響的故障可經(jīng)設(shè)計(jì)師確認(rèn),由運(yùn)管人員直接操控。因此國(guó)內(nèi)在航天器的故障診斷方面仍處于實(shí)驗(yàn)階段,并且如何將已有科研成果應(yīng)用到實(shí)際型號(hào)任務(wù)中去還值得進(jìn)一步研究,在理論和實(shí)踐方面仍有大量的研究和開(kāi)發(fā)工作要做,考慮到星載計(jì)算機(jī)的性能和在軌衛(wèi)星的安全性和可靠性,航天器故障診斷仍以地面遙測(cè)數(shù)據(jù)分析診斷為主。當(dāng)前國(guó)內(nèi)基于遙測(cè)參數(shù)超限報(bào)警的主要方法有遙測(cè)參數(shù)門(mén)限判斷、相對(duì)值判斷和關(guān)聯(lián)診斷方法;基于推理報(bào)警方法主要有規(guī)則、故障樹(shù)、人工神經(jīng)網(wǎng)絡(luò)和模型的推理方法。
在工程實(shí)際應(yīng)用方面,國(guó)內(nèi)大部分衛(wèi)星在設(shè)計(jì)時(shí)對(duì)一些突發(fā)故障進(jìn)行了考慮,在軌衛(wèi)星具有一定的自主判斷和應(yīng)急處理能力,主要是儀器設(shè)備的冗余使用,或者進(jìn)行應(yīng)急安全模式,也就是進(jìn)行太陽(yáng)搜索模式,同時(shí)關(guān)閉不必要的儀器設(shè)備,以保證整星能源供應(yīng)為主。目前,國(guó)內(nèi)在東方紅-3、資源-1、資源-2和“神舟”飛船等項(xiàng)目應(yīng)用中部分子系統(tǒng)已采用故障隔離、診斷和系統(tǒng)重構(gòu)等智能化技術(shù),收到了良好效果。對(duì)于星載計(jì)算機(jī)自身設(shè)計(jì),一般會(huì)設(shè)計(jì)簡(jiǎn)單的部件故障檢測(cè)能力,能在某些特定情況下自主切換部件和改變系統(tǒng)模式。同時(shí)星載計(jì)算機(jī)也具有一定的自檢能力和容錯(cuò)能力,能通過(guò)心跳檢測(cè)和看門(mén)狗檢測(cè)實(shí)現(xiàn)一些突發(fā)事件的處理如單粒子翻轉(zhuǎn)后的重啟等。
地面采集的遙測(cè)、外測(cè)數(shù)據(jù)有幾個(gè)特點(diǎn):①衛(wèi)星在軌運(yùn)行后,由于部件的冗余備份關(guān)系,故障特征可能并不明顯,有可能被淹沒(méi)在大量正常的遙測(cè)數(shù)據(jù)當(dāng)中。②衛(wèi)星在軌運(yùn)行后,大部分時(shí)間處于正常運(yùn)行態(tài),故障發(fā)生的情況并不是頻繁出現(xiàn)的,但故障出現(xiàn)后往往會(huì)存在一段時(shí)間。③衛(wèi)星在軌運(yùn)行后,地面獲得的遙測(cè)數(shù)據(jù)有可能由于人為因素或者儀器失靈等原因造成數(shù)據(jù)缺失。④衛(wèi)星在軌運(yùn)行后,由于天上的復(fù)雜情況,可能會(huì)出現(xiàn)某些地面沒(méi)有想到的故障情況或者由于地面測(cè)試時(shí)無(wú)法進(jìn)行的實(shí)驗(yàn)而造成某些故障情況出現(xiàn),即出現(xiàn)“未知”故障。
因此,在故障現(xiàn)象的檢測(cè)與診斷過(guò)程中需要考慮的問(wèn)題主要有:
1)為解決大量遙測(cè)數(shù)據(jù)的絕對(duì)門(mén)限判讀全面、準(zhǔn)確的問(wèn)題,可以增加相對(duì)門(mén)限判斷,扣除因時(shí)間變化,或測(cè)控事件發(fā)生前后遙測(cè)參數(shù)正常變化引起的誤判斷,建立動(dòng)態(tài)門(mén)限,以減少故障檢測(cè)過(guò)程中的虛警,保證故障特征識(shí)別的準(zhǔn)確性;
2)在進(jìn)行故障診斷軟件的容錯(cuò)、冗余性設(shè)計(jì)時(shí),可考慮是否因遙測(cè)數(shù)據(jù)源切換導(dǎo)致遙測(cè)數(shù)據(jù)的誤判,是否因?yàn)檫b控指令的發(fā)送導(dǎo)致某些波道參數(shù)的誤判、對(duì)于正常的星上遙測(cè)自主變化狀態(tài)是否視為異常;
3)應(yīng)定期對(duì)當(dāng)前在軌衛(wèi)星運(yùn)行健康狀況進(jìn)行有效評(píng)估,對(duì)于故障的實(shí)時(shí)處置有很大幫助;研究表明,衛(wèi)星在軌初期出現(xiàn)過(guò)的異常將在衛(wèi)星全壽命期一直存在;針對(duì)以往出現(xiàn)過(guò)的衛(wèi)星故障現(xiàn)象進(jìn)行處置預(yù)案的制定,將非常有效。
知識(shí)庫(kù)的完備性與有效性
知識(shí)庫(kù)是故障診斷系統(tǒng)第一個(gè)重要組成部分,故障診斷系統(tǒng)工作性能優(yōu)劣的重要因素取決于專(zhuān)家的知識(shí)和經(jīng)驗(yàn)。知識(shí)庫(kù)中的知識(shí)應(yīng)該具有可用性、確定性和完善性。
建立一個(gè)好的知識(shí)庫(kù),首先是從領(lǐng)域?qū)<夷抢铽@取知識(shí),稱(chēng)其為知識(shí)獲?。蝗缓髮@取的專(zhuān)家知識(shí)編排成數(shù)據(jù)結(jié)構(gòu)存入計(jì)算機(jī)中而形成知識(shí)庫(kù),知識(shí)編排的過(guò)程稱(chēng)為知識(shí)表達(dá)。一個(gè)理想的知識(shí)表達(dá),應(yīng)能精確表達(dá)專(zhuān)家的思維與知識(shí),應(yīng)該能有效地通過(guò)計(jì)算機(jī)進(jìn)行實(shí)現(xiàn),應(yīng)該簡(jiǎn)明、易于理解和便于改進(jìn)。
建立衛(wèi)星故障實(shí)時(shí)處置的知識(shí)庫(kù)需要考慮的問(wèn)題主要有:①衛(wèi)星的應(yīng)急處置預(yù)案是否完備,是否覆蓋了在軌可能出現(xiàn)的所有故障;②故障預(yù)案與實(shí)時(shí)處置腳本集的對(duì)應(yīng)關(guān)系是否準(zhǔn)確;③對(duì)故障知識(shí)的描述是否可以準(zhǔn)確表達(dá)衛(wèi)星在軌故障。
在對(duì)衛(wèi)星進(jìn)行在軌故障預(yù)想與故障對(duì)策分析時(shí),還應(yīng)充分考慮其他同類(lèi)型衛(wèi)星在軌曾經(jīng)發(fā)生過(guò)的異?,F(xiàn)象的舉一反三,并將這部分內(nèi)容包括到故障預(yù)案處置卡中。
處置的準(zhǔn)確性與時(shí)效性
衛(wèi)星在軌階段可能突發(fā)一些危害性較大的緊急故障,必須立即處理,否則導(dǎo)致整星失效,例如對(duì)動(dòng)量輪掉電、星上計(jì)算機(jī)故障等異常處置不及時(shí),可能使衛(wèi)星姿態(tài)帶來(lái)翻轉(zhuǎn)。這部分采用故障實(shí)時(shí)處置可以很大程度地減少人工處置工作量,降低對(duì)崗位人員的要求,保證載荷操作的正確性。
在設(shè)計(jì)故障實(shí)時(shí)處置時(shí),必須處理好與正??刂屏鞒讨g的關(guān)系:對(duì)于實(shí)時(shí)性要求很高的故障處置,在處置過(guò)程中必須確保遙控操作的優(yōu)先權(quán);對(duì)于實(shí)時(shí)性要求不高的故障處置,可以安排在正常載荷應(yīng)用任務(wù)之后或任務(wù)間隙實(shí)施。
處置評(píng)估與再處置
它是在故障處置過(guò)程中實(shí)時(shí)監(jiān)視實(shí)施效果,并依據(jù)一定的評(píng)估準(zhǔn)則對(duì)處置效果進(jìn)行評(píng)估,評(píng)估結(jié)果可作為是否進(jìn)行下一步處置的依據(jù)。需要考慮的問(wèn)題有:①故障處置評(píng)估的依據(jù)主要有星上下傳的遙測(cè)數(shù)據(jù),以及衛(wèi)星的實(shí)時(shí)軌道數(shù)據(jù);②影響處置評(píng)估的因素與故障檢測(cè)的因素有相似之處,同樣需要解決大量遙測(cè)數(shù)據(jù)的絕對(duì)門(mén)限判讀全面、準(zhǔn)確的問(wèn)題,以及測(cè)控事件發(fā)生前后遙測(cè)參數(shù)正常變化引起的誤判斷、虛警,保證故障處置結(jié)果評(píng)估的準(zhǔn)確性;③遙控指令腳本運(yùn)行完畢后,應(yīng)將運(yùn)行結(jié)果反饋給系統(tǒng)的故障檢測(cè)。
下面以一個(gè)典型的衛(wèi)星故障實(shí)時(shí)處置案例對(duì)衛(wèi)星故障實(shí)時(shí)處置過(guò)程進(jìn)行描述。
(1)故障檢測(cè)
讀取數(shù)據(jù)庫(kù)中的地敏探頭干擾預(yù)報(bào)結(jié)果,實(shí)時(shí)判斷接收的衛(wèi)星遙測(cè)數(shù)據(jù),檢測(cè)是否出現(xiàn)地敏探頭禁止遙測(cè)位報(bào)警,從而完成故障的實(shí)時(shí)檢測(cè)。
(2)故障診斷與定位
由于該故障在衛(wèi)星長(zhǎng)期在軌管理過(guò)程中出現(xiàn)過(guò),因此,根據(jù)知識(shí)庫(kù)中的先驗(yàn)知識(shí),可以定位該故障為地敏探頭自主切換異常。
(3)故障處置策略生成
根據(jù)事先制訂的故障預(yù)案,處置策略為:地面遙控發(fā)令,設(shè)置受干擾地敏探頭禁止。
(4)故障處置
故障處置包括如下兩個(gè)過(guò)程:①根據(jù)地面站集中監(jiān)視軟件的輸出信息,自主判斷當(dāng)前地面站是否已經(jīng)加載測(cè)控上行,如果沒(méi)有,通過(guò)調(diào)度軟件自動(dòng)調(diào)用“測(cè)控加上行”設(shè)備腳本,確保星地測(cè)控通道正常;②自主綜合判斷設(shè)備腳本運(yùn)行結(jié)果和中繼衛(wèi)星遙控鎖定情況,確認(rèn)上行已經(jīng)加載后,自主調(diào)用衛(wèi)星控制腳本,設(shè)置受干擾地敏探頭禁止。
(5)處置效果評(píng)估
衛(wèi)星控制腳本正常運(yùn)行完畢后,實(shí)時(shí)判斷中繼衛(wèi)星遙測(cè)數(shù)據(jù),確認(rèn)受干擾地敏探頭已經(jīng)正常禁止,且系統(tǒng)其他狀態(tài)均正常,則認(rèn)為異常處置正常結(jié)束。
故障實(shí)時(shí)處置流程示意圖
故障的實(shí)時(shí)處置在彌補(bǔ)人工處置時(shí)效性的不足時(shí),也對(duì)故障的檢測(cè)、識(shí)別、故障指令上行注入方式設(shè)計(jì)等提出了很高的要求。因此,在衛(wèi)星控制中心進(jìn)行故障實(shí)時(shí)處置系統(tǒng)設(shè)計(jì)與建設(shè)時(shí),需要結(jié)合實(shí)際工程背景,采用多參數(shù)聯(lián)合判斷、多觸發(fā)條件識(shí)別的方法,同時(shí)借鑒同型號(hào)衛(wèi)星故障處置預(yù)案,建立開(kāi)放的診斷知識(shí)庫(kù)與故障處置庫(kù),提高診斷的準(zhǔn)確性、處置的有效性與時(shí)效性。
Handling In-orbit Satellite anomalies in Real Time