(中國衛(wèi)星海上測控部,江蘇 江陰 214431)
S頻段統(tǒng)一測控系統(tǒng)是我國航天工程和衛(wèi)星測控網(wǎng)的重要組成部分,主要任務(wù)是對S頻段航天器進(jìn)行跟蹤測量、軌道和姿態(tài)控制及遙測監(jiān)視,集跟蹤、測量、控制、通信于一體,確保航天器按照預(yù)先設(shè)計(jì)好的軌道運(yùn)行與返回,以完成規(guī)定的航天任務(wù)。
隨著信息技術(shù)的發(fā)展,S頻段統(tǒng)一測控系統(tǒng)開始向集成化、自動化的方向跨越。然而,測控設(shè)備在功能和性能提高的同時,由于組成環(huán)節(jié)和影響因素的增加,發(fā)生故障或失效的可能性也隨之增大。個別部件故障常常會引起連鎖反應(yīng),導(dǎo)致任務(wù)過程失敗甚至整套設(shè)備癱瘓[1-2]。本文引入故障預(yù)測和健康管理技術(shù),設(shè)計(jì)了一種故障診斷系統(tǒng),主要完成S頻段統(tǒng)一測控系統(tǒng)可監(jiān)控設(shè)備的故障狀態(tài)監(jiān)測、生命周期管理、任務(wù)結(jié)果預(yù)測,通過對獲得的數(shù)據(jù)處理進(jìn)行故障預(yù)測與故障診斷,在嚴(yán)重故障發(fā)生之前進(jìn)行故障的預(yù)報(bào)與處理,避免出現(xiàn)嚴(yán)重后果,保證系統(tǒng)可靠、安全運(yùn)行。同時與系統(tǒng)監(jiān)控臺共用數(shù)據(jù)庫,具備全系統(tǒng)設(shè)備健康管理信息進(jìn)行存儲管理功能[3]。
健康故障診斷系統(tǒng)架構(gòu)分為故障信息采集、信息服務(wù)、應(yīng)用服務(wù)等三層,總體架構(gòu)如圖1所示。
圖1 健康故障診斷系統(tǒng)架構(gòu)
故障信息采集層是對歷次系統(tǒng)/設(shè)備健康狀態(tài)預(yù)測、標(biāo)校、測試、任務(wù)狀態(tài)以及任務(wù)數(shù)據(jù)分析的積累,不僅可供瀏覽與統(tǒng)計(jì)分析,還可用于后續(xù)健康狀態(tài)預(yù)測和任務(wù)執(zhí)行狀態(tài)預(yù)測。故障信息采集的對象是地面站內(nèi)所有設(shè)備,包括天飼饋分系統(tǒng)、發(fā)射及接收分系統(tǒng)、時頻分系統(tǒng)、基帶分系統(tǒng)、標(biāo)校分系統(tǒng)、自動化測試分系統(tǒng)及記錄分系統(tǒng)等。
信息服務(wù)層是對故障診斷系統(tǒng)中的所有信息進(jìn)行集中管理。除了對故障信息采集層信息的存儲,還包括專家知識、健康狀態(tài)評估模型、參數(shù)趨勢預(yù)測模型等。專家知識主要用于系統(tǒng)故障診斷與定位,是對傳統(tǒng)故障診斷系統(tǒng)知識庫的繼承;健康狀態(tài)評估模型存儲評估指標(biāo)與評估方法;參數(shù)趨勢預(yù)測模型通過基于時間序列的預(yù)測算法對設(shè)備關(guān)鍵參數(shù)進(jìn)行趨勢的預(yù)測。
應(yīng)用服務(wù)層主要實(shí)現(xiàn)故障診斷定位、健康狀態(tài)評估、任務(wù)能力評估、趨勢預(yù)測等應(yīng)用功能,它通過采集分系統(tǒng)或設(shè)備健康狀態(tài)信息、其它設(shè)備檢測信息、系統(tǒng)標(biāo)校數(shù)據(jù)、系統(tǒng)測試數(shù)據(jù)以及任務(wù)數(shù)據(jù)作為系統(tǒng)健康管理的原始數(shù)據(jù),結(jié)合歷史數(shù)據(jù)、健康評估模型、專家知識與推理,對系統(tǒng)健康狀態(tài)進(jìn)行評估;應(yīng)用服務(wù)層還能根據(jù)系統(tǒng)當(dāng)前的健康狀態(tài),安排維修保障計(jì)劃。
應(yīng)用軟件包括健康管理軟件、數(shù)據(jù)服務(wù)軟件、數(shù)據(jù)庫管理軟件等組成,其中數(shù)據(jù)服務(wù)軟件、數(shù)據(jù)庫管理軟件與監(jiān)控分系統(tǒng)軟件共用一套軟件。各軟件關(guān)系以及交互的信息如圖2所示。
圖2 故障診斷相關(guān)軟件組成及交互信息
健康故障診斷系統(tǒng)工作時,通過系統(tǒng)監(jiān)控軟件定時查詢采集各分系統(tǒng)/設(shè)備監(jiān)控單元上報(bào)的設(shè)備工作參數(shù)及狀態(tài)監(jiān)測信息,實(shí)時將信息寫入綜合數(shù)據(jù)庫,同時向健康故障診斷系統(tǒng)發(fā)送故障監(jiān)測點(diǎn)的監(jiān)測信息;健康故障診斷軟件接收監(jiān)測點(diǎn)信息,并實(shí)時檢查,若監(jiān)測到有異常情況,則啟動故障樹診斷、鏈路測試等分析處理流程,在診斷處理過程中需要借助標(biāo)校、測試手段進(jìn)行輔助診斷時,健康管理軟件向系統(tǒng)監(jiān)控軟件提交標(biāo)校、測試請求;系統(tǒng)監(jiān)控軟件接收故障診斷軟件的自動化測試請求,綜合考慮系統(tǒng)實(shí)際情況,為標(biāo)校測試分配設(shè)備資源,并確定標(biāo)校測試時間,生成標(biāo)校測試計(jì)劃,控制自動化測試軟件完成測試,并將測試結(jié)果提供給故障診斷軟件,作為故障診斷及健康狀態(tài)評估的事實(shí)依據(jù)。自動化測試軟件是健康管理軟件測試執(zhí)行者,接收系統(tǒng)監(jiān)控軟件的測試命令,執(zhí)行測試后將測試結(jié)果通過系統(tǒng)監(jiān)控軟件上報(bào)健康管理軟件。
設(shè)備故障監(jiān)測點(diǎn)基本類型大致劃分為兩類:枚舉型和數(shù)值型。設(shè)備故障識別時,依據(jù)故障監(jiān)測點(diǎn)知識規(guī)則,作如下判斷:
枚舉型故障監(jiān)測點(diǎn)是指上報(bào)的狀態(tài)數(shù)據(jù)固定為一個有限集合中的一個元素的設(shè)備故障監(jiān)測點(diǎn),當(dāng)其上報(bào)狀態(tài)為有限集合中特定元素時,識別為故障。例如:設(shè)備電源故障監(jiān)測點(diǎn)狀態(tài)數(shù)據(jù)集合為:{正常、異常},當(dāng)其上報(bào)的狀態(tài)為“異?!睍r,可識別為故障。一般設(shè)置參數(shù)為:故障狀態(tài)數(shù)據(jù)和連續(xù)上報(bào)次數(shù)(默認(rèn)為3)。例如,設(shè)備電源狀態(tài)監(jiān)測點(diǎn)設(shè)置參數(shù)為:狀態(tài)數(shù)據(jù):異常;連續(xù)上報(bào)次數(shù):3。即:設(shè)備電源狀態(tài)監(jiān)測點(diǎn)連續(xù)3次上報(bào)狀態(tài)數(shù)據(jù)為“異?!?,可判斷為故障。連續(xù)多次異常才能定位為故障,主要用于防止虛警。
數(shù)值型故障監(jiān)測點(diǎn)是指上報(bào)的狀態(tài)數(shù)據(jù)固定為一個或數(shù)個有界區(qū)間,當(dāng)狀態(tài)數(shù)據(jù)不在有界區(qū)間范圍內(nèi),識別為故障。例如:天線方位驅(qū)動電機(jī)電流狀態(tài)監(jiān)測點(diǎn)狀態(tài)數(shù)據(jù)區(qū)間為[0,41](單位:A),當(dāng)該故障監(jiān)測點(diǎn)上報(bào)數(shù)據(jù)為46A時,可識別為故障。一般設(shè)置參數(shù)為:故障狀態(tài)數(shù)據(jù)區(qū)間范圍(上限、下限)、單位和連續(xù)上報(bào)時間(默認(rèn)為5)。例如,天線方位驅(qū)動電機(jī)電流故障監(jiān)測點(diǎn)設(shè)置參數(shù)為:上限:0;下限:41;單位:A;連續(xù)上報(bào)時間:10。即:天線方位驅(qū)動電機(jī)電流連續(xù)10秒鐘超過正常區(qū)間[0,41],可判斷為故障。連續(xù)一段時間超限才能定位為故障,主要用于防止突發(fā)值和虛警。
天伺饋設(shè)備健康管理通過天伺饋監(jiān)控軟件采集設(shè)備傳感器信息,將設(shè)備狀態(tài)上報(bào)監(jiān)控分系統(tǒng),最終由健康管理分系統(tǒng)對設(shè)備采集數(shù)據(jù)的分析處理提取設(shè)備特征信息,完成對當(dāng)前天線設(shè)備的故障診斷、健康評估和預(yù)測,并形成診斷、評估、預(yù)測報(bào)告,顯示診斷、評估、預(yù)測結(jié)果。采集傳感器信息有:電機(jī)的電樞電流、電樞電壓、測速機(jī)反饋、振動、溫度等信息[4-5];天線中心體溫度、濕度、攝像等信息[6]。
多功能數(shù)字基帶分系統(tǒng)的基帶硬件平臺、角誤差切換單元、時碼終端、測試信號切換單元的健康管理通過各自設(shè)備的監(jiān)控軟件采集設(shè)備傳感器信息,將設(shè)備狀態(tài)上報(bào)監(jiān)控分系統(tǒng),最終由健康管理分系統(tǒng)對設(shè)備采集數(shù)據(jù)的分析處理提取設(shè)備特征信息,完成對當(dāng)前基帶設(shè)備的故障診斷、健康評估和預(yù)測,并形成診斷、評估、預(yù)測報(bào)告,顯示診斷、評估、預(yù)測結(jié)果。
在高頻信道分系統(tǒng)設(shè)備中,對插箱內(nèi)有源模塊設(shè)置了多個監(jiān)測點(diǎn),包括直流電源、本振信號幅度、變頻器供電等,可實(shí)時監(jiān)測設(shè)備運(yùn)行狀態(tài)及故障檢測并顯示,無源模塊及電纜的檢測需依據(jù)無源模塊前后相連的有源模塊來進(jìn)行邏輯判別或通過自動化測試來輔助判別,確保所有模塊監(jiān)測無遺漏,實(shí)現(xiàn)快速發(fā)現(xiàn)和解決設(shè)備問題。
基于故障樹的設(shè)備故障診斷流程分為設(shè)備狀態(tài)信號采集、設(shè)備故障識別、設(shè)備故障分析診斷及故障診斷決策四個階段[7-8]。
1)設(shè)備狀態(tài)信號采集。系統(tǒng)監(jiān)控軟件采集全系統(tǒng)設(shè)備監(jiān)測點(diǎn)的工作參數(shù)及狀態(tài)信息,并定時上報(bào)到故障診斷軟件作為設(shè)備故障診斷的事實(shí)依據(jù)。
2)設(shè)備故障識別。故障診斷軟件掃描設(shè)備監(jiān)控信息中的故障監(jiān)測點(diǎn),檢測并識別設(shè)備故障。
3)設(shè)備故障分析診斷。發(fā)現(xiàn)設(shè)備故障后,根據(jù)故障設(shè)備的故障樹模型,依據(jù)故障檢測識別規(guī)則知識庫、各種閉環(huán)檢測結(jié)果,進(jìn)行故障分析、推理判斷,定位故障設(shè)備。
4)故障診斷決策。故障診斷軟件識別判斷設(shè)備故障,定位到故障設(shè)備或模塊后,通知系統(tǒng)監(jiān)控任務(wù)管理模塊相應(yīng)故障設(shè)備資源離線維護(hù),不再分配給下次任務(wù)計(jì)劃;同時在系統(tǒng)配置框圖上和設(shè)備機(jī)柜圖上加亮顯示故障設(shè)備。當(dāng)最終出現(xiàn)系統(tǒng)無法理解或無法推理出結(jié)論的故障后,系統(tǒng)提示由操作員進(jìn)行人工檢測處理,如中間產(chǎn)生新知識,可更新知識庫。設(shè)備故障診斷流程如圖3所示。
圖3 設(shè)備故障診斷流程
故障診斷軟件依據(jù)知識庫中故障監(jiān)測點(diǎn)的知識和規(guī)則,從工作參數(shù)及狀態(tài)中提取設(shè)備故障監(jiān)測點(diǎn)信息,檢測、判斷并識別故障;并依據(jù)需要,展開設(shè)備信號流閉環(huán)檢測。故障診斷系統(tǒng)中,故障分析診斷推理主要通過“故障診斷業(yè)務(wù)流程控制”、“規(guī)則引擎”、“知識庫”等三部分負(fù)責(zé),其中故障診斷業(yè)務(wù)流程控制主要負(fù)責(zé)診斷過程調(diào)度,依據(jù)規(guī)則引擎反饋的規(guī)則推理結(jié)果反饋實(shí)現(xiàn)故障診斷過程的調(diào)度;規(guī)則引擎負(fù)責(zé)分析推理,主要通過ReteOO/Leap算法,實(shí)現(xiàn)測控系統(tǒng)領(lǐng)域知識(規(guī)則)與系統(tǒng)監(jiān)控臺上報(bào)的事實(shí)依據(jù)(監(jiān)測點(diǎn)狀態(tài)、測試結(jié)果等)匹配和推理,獲得推理結(jié)論;“故障診斷業(yè)務(wù)流程控制”、“規(guī)則引擎”協(xié)同工作,共同分析診斷,輸出診斷結(jié)果報(bào)告,如圖4所示。
圖4 規(guī)則引擎在故障診斷系統(tǒng)中的地位
設(shè)備故障樹,就是以單個設(shè)備或插箱作為故障診斷分析的目標(biāo),以設(shè)備故障作為頂事件,通過逐層分析原因而形成的故障樹[9-10]。為更好地進(jìn)行設(shè)備故障分析定位,對設(shè)備故障樹的底事件進(jìn)行了擴(kuò)展、分類,設(shè)備故障樹分解到底層,最終底事件包括以下類型:
1)直接判斷事件:通過設(shè)備插箱設(shè)置的直接監(jiān)測點(diǎn)進(jìn)行故障原因判斷定位。
2)聯(lián)合判斷事件:通過前后有源模塊檢測點(diǎn)的狀態(tài)顯示,聯(lián)合判定模塊、電纜等是否發(fā)生故障,確定故障原因,定位故障單元。
3)交叉檢測事件:利用切換開關(guān),對鏈路設(shè)備前后級設(shè)備進(jìn)行相互切換,依據(jù)切換后不同表現(xiàn),進(jìn)行故障分析、判斷、定位,最后確定故障原因。
4)診斷測試事件:通過利用自動化測試分系統(tǒng)測試設(shè)備,將設(shè)備設(shè)置在射頻閉環(huán)或中頻閉環(huán)下,根據(jù)信號流或數(shù)據(jù)流,分級檢測信號特性,進(jìn)行故障分析、判斷、定位,最后確定故障原因。
僅憑故障監(jiān)測點(diǎn)是不能完全反映出設(shè)備健康狀態(tài),有時需要根據(jù)診斷測試事件進(jìn)行故障分析定位。如對于S頻段統(tǒng)一測控系統(tǒng)的低噪聲場效應(yīng)放大器(LNA),雖然它的工作電流狀態(tài)(根據(jù)LNA各級放大器總的工作電流與參考值進(jìn)行比較后得出)是正常的,但如果LNA的輸入輸出匹配電路、串聯(lián)的隔直電容出現(xiàn)了故障,都會導(dǎo)致LNA不能正常工作。噪聲溫度、增益等性能指標(biāo)可以比較客觀地反映LNA健康與否。但受限于LNA接收信號的動態(tài)范圍和安裝的環(huán)境條件等客觀因素,噪聲溫度、增益等信息難以實(shí)時上報(bào)給健康管理分系統(tǒng),需要借助自動化測試設(shè)備在非任務(wù)條件下進(jìn)行測量和計(jì)算。以下是LNA+D/C增益的推導(dǎo)過程:
根據(jù)圖5所示的測試框圖進(jìn)行LNA、D/C增益的測量。下行鏈路通過自動化測試設(shè)備、測試上變頻器閉環(huán)。在自動化測試軟件的控制下,控制信號源發(fā)送單載波信號,用頻譜儀監(jiān)測下行輸出信號的頻譜;根據(jù)信號的頻譜特征,可判斷下行鏈路的狀態(tài)(其中X1~X10為各點(diǎn)信號幅度)。
圖5 LNA+D/C增益測試框圖
(1)
式(1)中,G為LNA+D/C的總增益(dB);P1為信號源輸出電平(dBm);P2為頻譜儀測量電平(dBm);LA為信號源輸出至LNA輸入端傳輸損耗(dB);LB為D/C輸出端至頻譜儀傳輸損耗(dB)。
LNA與D/C安裝在天線中心體的高頻箱內(nèi),它們之間沒有監(jiān)測點(diǎn)。當(dāng)測得的總增益正常時,可認(rèn)為LNA與D/C均正常。當(dāng)出現(xiàn)故障時,無法直接斷定具體是哪個模塊發(fā)生了故障,一般可采用交叉定位的手段進(jìn)行分離,如圖6所示。當(dāng)檢測到LNA1+D/C1鏈路增益不正常、而LNA2+D/C2鏈路增益正常時,改變鏈路連接關(guān)系,分別測量LNA1+D/C2鏈路增益、LNA2+D/C1鏈路增益,通過篩選,可分離出具體的故障模塊。
圖6 交叉定位法示意圖
本文從S頻段統(tǒng)一測控系統(tǒng)的特點(diǎn)出發(fā),融合計(jì)算技術(shù)、數(shù)據(jù)存儲技術(shù)和軟件工程技術(shù),設(shè)計(jì)了一種由船載測控系統(tǒng)構(gòu)成的健康故障診斷系統(tǒng)集成框架,并分析了其系統(tǒng)組成和關(guān)鍵測試技術(shù)影響。所設(shè)計(jì)的健康故障診斷系統(tǒng)可以提高系統(tǒng)故障診斷和預(yù)測精度、擴(kuò)展?fàn)顟B(tài)監(jiān)控和管理的對象,能在增長性能和降低成本的需求背景下,提高測控任務(wù)執(zhí)行的成功率以及自動化率。雖然目前尚處于初步發(fā)展階段,但代表了未來航天測控故障診斷的發(fā)展方向,必將為航天測控站的無人化、自動化打下堅(jiān)實(shí)的基礎(chǔ)。