余晟 張海祥 宋宏江 何曉宇 閆金棟
(北京空間飛行器總體設(shè)計部,北京 100094)
Key words:satellite;health status monitoring;machine learning;clustering algorithm
基于推演式聚類學習算法的衛(wèi)星健康狀態(tài)監(jiān)視系統(tǒng)
余晟 張海祥 宋宏江 何曉宇 閆金棟
(北京空間飛行器總體設(shè)計部,北京 100094)
提出一種基于推演式聚類學習算法的衛(wèi)星通用健康狀態(tài)監(jiān)視系統(tǒng),應(yīng)用衛(wèi)星運行數(shù)據(jù)構(gòu)建多維空間向量集,通過聚類生成健康狀態(tài)知識庫,可以實時監(jiān)視衛(wèi)星遙測狀態(tài)。使用某衛(wèi)星熱控分系統(tǒng)的測試數(shù)據(jù)對該系統(tǒng)的有效性進行了驗證,結(jié)果表明:該系統(tǒng)具有較好的衛(wèi)星異常健康狀態(tài)識別與評估的能力和準確度,可為衛(wèi)星健康狀態(tài)監(jiān)視手段的選擇提供參考。
衛(wèi)星;健康狀態(tài)監(jiān)視;機器學習;聚類學習算法
Key words:satellite;health status monitoring;machine learning;clustering algorithm
衛(wèi)星健康狀態(tài)監(jiān)視軟件的目標是及時發(fā)現(xiàn)衛(wèi)星可能存在的異常問題,提升異常問題的識別率對保障衛(wèi)星在軌正常運行具有重要意義[1]。隨著衛(wèi)星系統(tǒng)復(fù)雜性的快速增長,對健康狀態(tài)監(jiān)視軟件的功能提出了更高的要求,主要表現(xiàn)在:①表征衛(wèi)星狀態(tài)的參數(shù)越來越多,由單一的參數(shù)判讀向多參數(shù)的聯(lián)合判讀轉(zhuǎn)變,多參數(shù)的狀態(tài)組合隨著參數(shù)個數(shù)的增加呈幾何級數(shù)的增長;②對判讀的精確度要求越來越高,由定性的狀態(tài)判讀向定量的狀態(tài)判讀轉(zhuǎn)變,為狀態(tài)的健康程度和偏離度給出定量的數(shù)據(jù);③系統(tǒng)自學習要求越來越緊迫,對于復(fù)雜的衛(wèi)星系統(tǒng),預(yù)先給出全面完整而且準確的判讀知識越來越困難,需要系統(tǒng)具備自學習功能。
國內(nèi)外學者對航天器健康狀態(tài)監(jiān)視方法進行了研究,文獻[2]提出采用聚類分析的方法,利用航天器歷史數(shù)據(jù)進行健康狀態(tài)建模。研究了基于劃分和模型的兩種聚類分析系統(tǒng)的方法,在此基礎(chǔ)上建立了航天器故障診斷模型,并使用Simlink軟件對算法進行仿真。研究的方法主要針對航天器姿態(tài)軌道控制系統(tǒng)的故障診斷工作。文獻[3]提出采用基于數(shù)據(jù)統(tǒng)計理論的自適應(yīng)相關(guān)算法,進行液體火箭發(fā)動機健康狀態(tài)的實時監(jiān)視,并使用火箭實際試車數(shù)據(jù)對算法有效性進行了驗證。文獻[4]提出建立有限元模型來進行航天器防熱系統(tǒng)的健康狀態(tài)監(jiān)視,這類建立模型的方法需要提前對故障知識和機理有深入的理解,不能使用歷史數(shù)據(jù),因此應(yīng)用范圍比較有限。文獻[5]使用BEAM(Beacon-based Exception Analysis for Multi-Missions)系統(tǒng)進行航天飛機主引擎數(shù)據(jù)的健康狀態(tài)監(jiān)視,BEAM系統(tǒng)是一個典型的單參數(shù)監(jiān)視系統(tǒng),不能進行多維參數(shù)聯(lián)合判讀。文獻[6]使用基于決策樹的方法來進行J-2X火箭發(fā)動機的故障診斷任務(wù)。
近年來,提出了基于數(shù)據(jù)驅(qū)動的健康狀態(tài)監(jiān)視方法,是使用機器學習的技術(shù)從衛(wèi)星運行過程中積累的大量數(shù)據(jù)中訓練系統(tǒng)健康狀態(tài)模型和判據(jù),以提高監(jiān)視發(fā)現(xiàn)異常問題并預(yù)判潛在風險的能力[7-8]。本文提出了一種推演式聚類學習算法來進行衛(wèi)星健康狀態(tài)模型訓練,實現(xiàn)了一種基于數(shù)據(jù)驅(qū)動的衛(wèi)星健康狀態(tài)監(jiān)視軟件,使用某衛(wèi)星熱控分系統(tǒng)在實際地面測試的試驗數(shù)據(jù)對該軟件的運行結(jié)果進行了驗證,結(jié)果表明該軟件對星上異常健康狀態(tài)的識別具有很高的準確率。
2.1 聚類學習算法
聚類學習算法是一類無監(jiān)督的機器學習方法。在無監(jiān)督學習算法中,訓練數(shù)據(jù)沒有被人工加上標簽,通過一定方法根據(jù)訓練數(shù)據(jù)本身的屬性進行分簇。本文采用的聚類學習算法屬于基于距離的聚類算法。其基本思想如下:假設(shè)衛(wèi)星健康狀態(tài)由一系列特征遙測參數(shù)的值來表述。這些遙測參數(shù)值映射為多維空間中的一個向量,不同時刻向量間距離大小可以表示狀態(tài)差異的程度,這是聚類學習算法的基礎(chǔ)。聚類算法使用衛(wèi)星正常狀態(tài)的運行數(shù)據(jù)作為訓練庫,經(jīng)聚類后獲得簇集的信息,簇集的信息構(gòu)成衛(wèi)星健康狀態(tài)模型。在進行健康狀態(tài)監(jiān)視時,待評估狀態(tài)輸入該模型,模型則輸出評估結(jié)果。典型的基于距離的聚類學習算法包括k-均值算法[9]和k-中心點算法[10]。本文采用推演式的聚類學習算法來進行衛(wèi)星某系統(tǒng)的健康模型的建立。推演式聚類學習算法的思想最早由NASA的噴氣推進實驗室(JPL)提出,并已應(yīng)用于“國際空間站”的飛行控制、“戰(zhàn)神”(Ares)運載火箭地面測試等的健康狀態(tài)監(jiān)視任務(wù),取得了良好的應(yīng)用效果[11],與k-均值等算法相比,推演式聚類算法引入健康狀態(tài)區(qū)域和簇成長率的概念,采用迭代學習的方式對簇的建立進行推演,使得傳統(tǒng)的聚類學習算法可以應(yīng)用于衛(wèi)星健康狀態(tài)監(jiān)控中。與基于規(guī)則的健康模型建立方法相比,本算法采用了基于數(shù)據(jù)的思想,具有以下優(yōu)點:①自學習功能,通過建立健康狀態(tài)評估模型對正常數(shù)據(jù)進行歸一化處理和訓練,自動提煉出衛(wèi)星健康狀態(tài);②定量判讀功能,通過與健康狀態(tài)的差異大小來定量描述衛(wèi)星的健康狀態(tài),區(qū)分衛(wèi)星異常狀態(tài)的等級;③多維判讀功能,通過對描述某一分系統(tǒng)或單機設(shè)備狀態(tài)的多個參數(shù)進行組合處理,全面反映衛(wèi)星某一分系統(tǒng)或單機設(shè)備的狀態(tài),提高判讀準確性。
2.2 推演式聚類學習算法設(shè)計思想
本文對推演式聚類學習算法參數(shù)的選擇和演算過程進行了改進,在推演式聚類學習算法中,原始訓練數(shù)據(jù)首先經(jīng)過歸一化處理后轉(zhuǎn)換成高維向量空間中的向量集。在聚類學習的過程中,向量集通過迭代的方式進行聚類。首先選擇一個初始向量作為起始的簇中心,然后,在算法執(zhí)行的每一步中,將訓練集中的一個向量根據(jù)到現(xiàn)有簇的最近距離將向量加入到現(xiàn)有的分簇中,如果距離超過簇半徑,則算法形成一個新的分簇。在每一步中,每個簇對應(yīng)的健康區(qū)域也根據(jù)向量分簇情況進行改變,形成對健康區(qū)域信息的迭代推演。上述推演式聚類過程主要由3個預(yù)先設(shè)定的參數(shù)控制:①最大簇半徑Rmax,控制分簇的大小,如果向量到簇中心的度量距離大于Rmax則建立新的分簇;②新簇起始大小比例Pinit控制分簇對應(yīng)健康區(qū)域的起始大小,在新簇建立時使用;③簇增長率Pinc,控制分簇對應(yīng)健康區(qū)域增長速度的快慢,在向量加入現(xiàn)有分簇時使用。
每個簇對應(yīng)的健康狀態(tài)區(qū)域是高維空間中的一個“方”形區(qū)域,即該區(qū)域中包含了每一個子維度上遙測參數(shù)值的上下限閾值。低于下限閾值或超過上限閾值的數(shù)據(jù)將會被認為是異常數(shù)據(jù)。簇起始大小Pinit和簇增長率Pinc的值用于控制健康狀態(tài)區(qū)域的變化速度。每當有一個新的數(shù)據(jù)向量加入簇,該簇對應(yīng)的健康狀態(tài)區(qū)域相應(yīng)維度的上下限按照簇增長率的大小進行變化。在簇起始大小一定的情況下,如果簇半徑和簇增長率越小,得到的分簇數(shù)量越大。
在算法實際運行過程中,Rmax、Pinit和Pinc的取值通過迭代的方法確定,首先計算訓練集Φ中向量兩兩之間距離的均方值:
假設(shè)通過算法獲得的期望分簇數(shù)為Nexpect,則Rmax、Pinit和Pinc的初始值為
簇半徑初始值為平均距離除以期望分簇數(shù),簇初始大小與期望分簇數(shù)成反比,簇增長率初始設(shè)為100%,該值表示當新向量加入某簇時,如果該向量在簇范圍外,則該簇的范圍更新后一定包含該向量。進行首輪分簇后,如果分簇結(jié)果數(shù)小于期望分簇數(shù),則將Rmax和Pinc的值各減小10%,如果分簇結(jié)果數(shù)大于期望分簇數(shù),則將Rmax和Pinc的值各增加10%,然后進行下一輪迭代,直至分簇結(jié)果數(shù)等于或接近期望分簇數(shù)為止。
2.3 衛(wèi)星健康狀態(tài)監(jiān)視系統(tǒng)的實現(xiàn)
基于上述算法的健康狀態(tài)監(jiān)視軟件系統(tǒng)的工作過程如圖1所示。
圖1 衛(wèi)星健康狀態(tài)監(jiān)視模型工作過程圖Fig.1 Satellite health status monitoring process
衛(wèi)星健康狀態(tài)監(jiān)視系統(tǒng)首先對訓練庫中的遙測數(shù)據(jù)進行歸一化建立輸入數(shù)據(jù)集,然后采用推演式聚類學習算法建立衛(wèi)星健康狀態(tài)知識庫,健康狀態(tài)知識的結(jié)構(gòu)如表1所示。在進行健康狀態(tài)監(jiān)視應(yīng)用時,系統(tǒng)將新數(shù)據(jù)向量與知識庫中的健康區(qū)域信息進行比較。如果數(shù)據(jù)向量位于健康區(qū)域之內(nèi),系統(tǒng)判斷分系統(tǒng)處于健康狀態(tài)。如果數(shù)據(jù)向量到健康區(qū)域的距離為一個較小的非0值,則系統(tǒng)發(fā)送一個低等級的警報信息,表示當前狀態(tài)暫時偏離正常工作狀態(tài),但衛(wèi)星仍處于健康狀態(tài)。如果數(shù)據(jù)向量連續(xù)處于健康區(qū)域之外,且到健康區(qū)域的距離較大,則認為系統(tǒng)此時處于異常狀態(tài),根據(jù)距離值的大小發(fā)送中等級或高等級的警報。此時系統(tǒng)根據(jù)不同維度上偏離量的大小,報告相應(yīng)的最有可能導致系統(tǒng)異常狀態(tài)的遙測參數(shù)。
為了驗證該系統(tǒng)在實際應(yīng)用中的有效性,現(xiàn)以某衛(wèi)星熱控分系統(tǒng)健康狀態(tài)評估與監(jiān)視系統(tǒng)為例,說明系統(tǒng)的構(gòu)建過程。該衛(wèi)星的熱控分系統(tǒng)主要由安全開關(guān)、加熱回路和測溫電阻構(gòu)成,用于健康狀態(tài)評估的遙測參數(shù)主要包含安全開關(guān)通斷狀態(tài)、自主控溫功能使能/禁止狀態(tài)、加熱回路溫度和測溫熱敏電阻溫度,其中i表示星上第i路加熱回路和測溫電阻。參數(shù)信息見表2。
表1 衛(wèi)星健康狀態(tài)知識示例Table 1 A sample of satellite health status knowledge
表2 熱控分系統(tǒng)健康狀態(tài)評估相關(guān)參數(shù)Table 2 Parameters used in health assessment of the thermal control subsystem
基于距離的分簇算法具有較好的通用性,不同遙測參數(shù)的組合均可以映射到多維空間中的向量,因此可以靈活地調(diào)整模型中遙測參數(shù)的類型和權(quán)重,適用不同類型的健康狀態(tài)評估任務(wù)。
為了驗證系統(tǒng)的有效性,作者開發(fā)了一套衛(wèi)星健康狀態(tài)監(jiān)視軟件,它使用C#語言開發(fā),目前已用于衛(wèi)星整星測試數(shù)據(jù)的監(jiān)視任務(wù)中。在該軟件中以某衛(wèi)星2014年1月24日至2014年12月31日期間的遙測數(shù)據(jù)值作為原始數(shù)據(jù)庫。其中,將2014年1月1日至2014年4月31日期間正常的遙測數(shù)據(jù)作為健康評估模型的訓練數(shù)據(jù),將2014年5月1日至2014年12月31日期間的遙測數(shù)據(jù)作為測試數(shù)據(jù)。訓練數(shù)據(jù)通過聚類學習軟件進行健康狀態(tài)模型的學習,并將所建立的健康狀態(tài)模型作為輸出文件進行保存。其中聚類學習軟件的運行界面如圖2所示。通過對參數(shù)的取值進行調(diào)校,在推演式聚類學習算法中使用的參數(shù)設(shè)置見表3。
圖2 航天器遙測數(shù)據(jù)推演式聚類學習軟件界面Fig.2 Interface of the spacecraft telemetry data deductive clustering software
表3 試驗中使用的參數(shù)值Table 3 Value of the parameters used in the experiment
將由聚類學習軟件得到的測試數(shù)據(jù)和健康狀態(tài)模型數(shù)據(jù)輸入到Matlab軟件,經(jīng)處理后得到測試數(shù)據(jù)的評估結(jié)果。實驗?zāi)繕耸前l(fā)現(xiàn)測試數(shù)據(jù)中的異常狀態(tài)信息,通過與實際衛(wèi)星測試日報中記錄的異常狀態(tài)進行對比,驗證軟件有效性和準確度。
Matlab軟件統(tǒng)計了2014年5月1日至2014年12月31日期間的遙測數(shù)據(jù)正常的數(shù)據(jù)點的數(shù)量和軟件發(fā)送的低、中、高級警報的數(shù)量。其中針對中、高級警報來測試日報的記錄統(tǒng)計異常狀態(tài)的誤報率和漏報率,即如果該日的測試日報中無異常狀態(tài)記錄,而軟件發(fā)送了中、高等級的警報,則認為該事件為誤報事件。如果該日的測試日報中有異常狀態(tài)記錄,但軟件沒有發(fā)送中、高等級的警報,則認為該事件是漏報事件。通過Matlab軟件將每個遙測數(shù)據(jù)點到健康區(qū)域的最小距離進行計算,然后根據(jù)這個距離值的大小統(tǒng)計在這段時間內(nèi)有哪些天出現(xiàn)了低、中、高等級警報。第一組遙測參數(shù)數(shù)據(jù)的算法運行結(jié)果如圖3所示,圖中橫軸為測試數(shù)據(jù)的采集時間,縱軸為測試數(shù)據(jù)點距離在衛(wèi)星健康知識庫中健康狀態(tài)區(qū)域的最小距離,虛線為各級警報的閾值。
圖3 健康狀態(tài)評估算法運行結(jié)果Fig.3 Results of the health status assessment algorithm
對所有十組數(shù)據(jù)運行了上述算法,經(jīng)統(tǒng)計,在2014年5月1日至2014年12月31日期間出現(xiàn)過低級警報的天數(shù)共有23天,中級警報共有8天,高級警報為2天。通過與測試日報與數(shù)據(jù)判讀軟件記錄的結(jié)果進行對比,在出現(xiàn)過中級警報及高級警報的日期中,均有測試異常狀態(tài)的記錄,其中軟件發(fā)出的低級警報主要由環(huán)境溫度的變化引起,中級警報均由進行溫度遙測參數(shù)解碼時的參數(shù)設(shè)置問題引起,高級警報則來自于熱控熱敏電阻本身讀數(shù)的異常。為了驗證該算法運行的有效性,統(tǒng)計了算法對試驗過程中出現(xiàn)的異常狀態(tài)的錯報率與不漏報率。試驗中算法的錯報率很低,接近于0%。將算法的不漏報率與傳統(tǒng)基于參數(shù)門限的健康監(jiān)視算法的不漏報率進行了對比,異常狀態(tài)的不漏報率為
式中:Dr為監(jiān)視軟件報告異常狀態(tài)的數(shù)量,DT為衛(wèi)星出現(xiàn)異常狀態(tài)的總數(shù)量。
試驗結(jié)果如圖4所示。由圖4可知,基于推演式聚類的監(jiān)視方法在對低、中級異常狀態(tài)具有更好的發(fā)現(xiàn)能力,與現(xiàn)有基于規(guī)則的監(jiān)視方法相比,基于推演式聚類學習的監(jiān)視算法具有較好的異常狀態(tài)發(fā)現(xiàn)能力,由于其具有多維度和自學習判讀的特點,可以彌補基于規(guī)則和專家知識的判讀方法的不足,能推廣應(yīng)用于更多航天器狀態(tài)監(jiān)視中。
圖4 異常狀態(tài)不漏報率對比Fig.4 Comparison of the no false negative rate for anomaly status
本文設(shè)計了一種基于推演式聚類學習算法的衛(wèi)星健康狀態(tài)監(jiān)視方法,在此基礎(chǔ)上實現(xiàn)了一種衛(wèi)星健康狀態(tài)監(jiān)視軟件。此方法將原始數(shù)據(jù)轉(zhuǎn)換為多維向量空間中的向量,通過迭加式的聚類學習算法對原始數(shù)據(jù)向量進行分簇,從而得到衛(wèi)星正常運行狀態(tài)下的健康區(qū)域信息,并將這些信息保存于軟件知識庫中。在監(jiān)視過程中,通過比較輸入數(shù)據(jù)與知識庫中的信息來判斷分系統(tǒng)當前的運行狀態(tài)。該算法具有自學習和多維數(shù)據(jù)聯(lián)合判讀功能,為衛(wèi)星健康狀態(tài)監(jiān)視工作提供了一種新的思路與方法。本文以熱控分系統(tǒng)為例,測試驗證了該健康狀態(tài)監(jiān)視方法在衛(wèi)星綜合測試應(yīng)用中的有效性,可有效推廣應(yīng)用于衛(wèi)星各個分系統(tǒng)的綜合測試以及衛(wèi)星在軌監(jiān)測工作中,能降低數(shù)據(jù)判讀門檻,提高狀態(tài)判讀的全面性和準確性。
(
)
[1]Iverson D L.Data mining applications for space mission operations system health monitoring[C]//Proceedings of the SpaceOps 2008Conference.Washington D.C.:AIAA,2008
[2]龔學兵.基于聚類分析衛(wèi)星姿態(tài)控制系統(tǒng)故障診斷方法研究[D].哈爾濱:哈爾濱工業(yè)大學,2011 Gong Xuebing.The research on satellite attitude control system diagnosis based on clustering analysis[D].Harbin:Harbin Institute of Technology,2011(in Chinese)
[3]劉洪剛,魏鵬飛,謝廷風,等.液體火箭發(fā)動機地面試車過程的實時故障檢測方法研究[J].宇航學報,2007,28(6):1660-1663 Liu Honggang,Wei Pengfei,Xie Tingfeng,et al.Research of real—time fault detection method for liquid propellant rocket engines in ground test[J].Journal of Astronautics,2007,28(6):1660-1663(in Chinese)
[4]張茂.重復(fù)使用跨大氣層飛行器防熱系統(tǒng)健康監(jiān)視技術(shù)研究[D].西安:西北工業(yè)大學,2006 Zhang Mao.Health monitoring for thermal protection systems on reusable launch vehicles[D].Xi’an:Northwestern Polytechnical University,2006(in Chinese)
[5]Park H,Mackey R,James,et al.Analysis of space shuttle main engine data using beacon-based exception analysis for multi-missions[C]//Proceedings of the Aerospace Conference.New York:IEEE,2002
[6]Schwabacher M,Aguilar R,F(xiàn)igueroa F.Using decision trees to detect and isolate simulated leaks in the J-2X rocket engine[C]//Proceedings of the IEEE Aerospace Conference.New York:IEEE,2009
[7]Quinlan J R.Programs for machine learning[M].San Mateo,CA:Morgan Kaufmann,1993
[8]Tao Zan,Min Wang.Information integration and diagnosis analysis of equipment status and production quality for machine process[C]//Fourth International Seminar on Modern Cutting and Measurement Engineering.Bellingham:SPIE,2011
[9]雷小鋒,謝昆青,林帆,等.一種基于K-Means局部最優(yōu)性的高效聚類算法[J].軟件學報,2008,19(7):1683-1692 Lei Xiaofeng,Xie Kunqing,Lin Fan,et al.A efficient clustering algorithm based on K-Means local optimization[J].Journal of Software,2008,19(7):1683-1692(in Chinese)
[10]Julia H,Knowles J,Kell D.Computational cluster validation in post—genomic data analysis[J].Bioinformatics,2005,21(15):3201-3212
[11]Iverson D,Matin R,Schwabacher M,et al.Generalpurpose data-driven system monitoring for space operations[J].Journal of Aerospace Computing,Information,and Communication,2012,9(2):26-44
(編輯:李多)
A Satellite Health Status Monitoring System Based on Deductive Clustering Algorithm
YU Sheng ZHANG Haixiang SONG Hongjiang HE Xiaoyu YAN Jindong
(Beijing Institute of Spacecraft System Engineering,Beijing 100094,China)
This paper proposes a satellite health status monitoring system based on a deductive clustering algorithm.The system constructs vector sets based on real data in satellite operations,and then builds a satellite health knowledge database.The system monitors satellite telemetry parameters in real time.The authors verify the correctness of the software based on a real test data set:the results show that the system can achieve high accuracy of satellite health assessment and diagnose,and can be a reference for selection of satellite health status monitoring measures.
V557.1
A
10.3969/j.issn.1673-8748.2016.05.013
2016-03-14;
2016-07-28
余晟,男,博士,工程師,從事星載軟件開發(fā)技術(shù)研究。Email:yusheng00@hotmail.com。