陳潤鋒,楊 宏
(中國空間技術研究院載人航天總體部,北京100094)
可靠性和安全性一直是航天工業(yè)中關注的重點問題,特別是載人航天領域。隨著載人航天活動的不斷拓寬,航天器性能不斷提高,系統(tǒng)的規(guī)模也越來越大、越來越復雜,系統(tǒng)發(fā)生故障/異常的可能性就越高,傳統(tǒng)依靠產品自身的可靠性,以及設計冗余備份的方法不足以確保系統(tǒng)的長期安全運行。
健康狀態(tài)是表征系統(tǒng)可靠性和安全性的重要指標,實時地掌控載人航天器系統(tǒng)的健康狀態(tài)愈發(fā)重要。健康狀態(tài)是指研究對象在完成其設計功能時的執(zhí)行能力,一般可以描述為正常(健康)、異常(非健康)、以及異常情況下不同程度的性能下降(偏離健康的程度)[1]。目前,健康狀態(tài)評估方法主要分成兩類:經典的評估方法和基于人工智能的評估方法。經典的評估方法包含有層次分析法(Analytic Hierarchy Process, AHP)[2]、模糊理論(Fuzzy Theory)[3]和 D-S 證據理論(D-S evidence theory)[4]等。 瞿紅春[5]使用 AHP 對發(fā)動機的健康狀態(tài)進行了評估,建立振動監(jiān)測、滑耗監(jiān)測、返廠維修等12個數據指標,并將最終權值相加的結果映射至[0,1]區(qū)間,作為發(fā)動機的健康指數。Abdullayev等[6]針對燃氣渦輪發(fā)動機狀態(tài)數據的不確定性,運用模糊理論建立了多線性和非線性描述模型來評價發(fā)動機的健康狀態(tài)。Liu B J等人[7]對液壓系統(tǒng)的工作狀態(tài)進行分類,利用D-S理論進行健康狀態(tài)評估,使用熵值法來確定證據理論中的權重。這類方法的基本思想是建立評價指標體系,計算指標權重,對所有指標進行權值相加,得到最終評價結果。人工智能的評估方法主要包含人工神經網絡(Artificial Neural Networks, ANN)[8]、支持向量機(Support Vector Machine, SVM)[9]和貝葉斯估計理論(Bayesian estimation theory)[10]。 Gao R X 等[11]以故障嚴重度為指標對軸承的健康狀態(tài)進行分類,利用小波變換提取出軸承振動數據特征量,用以訓練神經網絡模型,實現(xiàn)對軸承健康狀態(tài)的判別功能。Huang H Z等人[12]利用SVM對軸承、電池的當前狀態(tài)進行評估,并建立了當前狀態(tài)與剩余壽命之間的聯(lián)系。孫見忠[13]提出了基于貝葉斯因子的民航發(fā)動機氣路部件性能評估的方法,并以發(fā)動機的排氣溫度裕度作為退化參數,建立了性能退化軌跡。這類方法主要是建立類似于人的學習和判斷模型,其中ANN和SVM主要通過對訓練樣本進行學習,建立起數據特征到健康狀態(tài)的映射模型,是一種“黑箱建?!钡乃枷耄回惾~斯方法首先建立研究對象隨時間變化的狀態(tài)空間模型,根據觀測數據來估計模型參數,以此作為對健康狀態(tài)的評估。
可以看出,目前研究成果的對象集中于一些具有重要功能的設備,然而,對于工業(yè)領域中的復雜系統(tǒng),相比于單臺設備的健康狀態(tài),工程中更為關注的是由這些設備組建成的整個系統(tǒng)的健康狀態(tài),例如載人航天器中的能源系統(tǒng),它包含有多個分系統(tǒng),每一個分系統(tǒng)又是由多種設備構成的,系統(tǒng)層的健康狀態(tài)則不能簡單地用幾臺核心單機設備的健康狀態(tài)來代替表述,還需要考慮到設備之間的相互作用關系。目前針對于系統(tǒng)層的健康狀態(tài)評估研究成果較少,Huang H Z等[14]闡述了系統(tǒng)層健康狀態(tài)的重要性,并使用模糊層次分析法(Fuzzy Analytic Hierarchy Process,F(xiàn)-AHP)來構建系統(tǒng)層的健康狀態(tài),這種方法的本質是一種賦權值而后進行累加的思想,權值能夠考慮組成成分的重要性,但這種方法不能很好地描述成分間的相互作用關系。陳雄姿等[15]嘗試將系統(tǒng)采集到的多維監(jiān)測數據統(tǒng)一映射到取值范圍為[0,1]的單維虛擬變量上,作為系統(tǒng)健康狀態(tài)的評估量,這種方法需要具備有大量同類型的歷史退化數據進行擬合,而復雜系統(tǒng)的造價通常十分昂貴,很難具備有同種工況條件下的多樣本退化數據作為技術支持。
本文以一種典型的大型載人航天器能源系統(tǒng)為研究對象,借助圖論和數據科學方法,結合工程中實際資源條件,提出一種新的系統(tǒng)健康狀態(tài)評估方法,以描述整個系統(tǒng)層的健康狀態(tài)。
在工業(yè)領域中,復雜系統(tǒng)通常包含有大量具有不同功能的單機設備,這些設備通過相互作用共同實現(xiàn)更高層的系統(tǒng)功能,相對于底層單機設備而言,系統(tǒng)層的功能特點是各項單機功能以及其相互作用產生效能的集成。因此,評估整個系統(tǒng)層的健康狀態(tài),不僅需要考慮各個單機的健康狀態(tài),同時也要考慮到單機設備間相互作用的狀態(tài)信息。復雜系統(tǒng)的拓撲結構通常呈現(xiàn)為網絡的形式,圖論是一種十分有效的描述網絡特性的數學工具,將系統(tǒng)中的設備視為節(jié)點,設備間的相互作用關系視為有向邊,則復雜系統(tǒng)的結構關系可以通過有向圖表示,對系統(tǒng)的健康狀態(tài)評估進而可以等價為對有向圖中各個成分的度量。
假設復雜系統(tǒng)S包含有N臺單機設備,與其對應的圖 G = (V,E),其中點集V = {vi,i∈N}表示系統(tǒng)中的所有設備,邊集E = {eij,i≠j,i∈N,j∈N}表示各臺設備之間的作用關系,這樣復雜系統(tǒng)就可以通過有向圖來表示,如圖1所示。
圖1 復雜系統(tǒng)的有向圖表示Fig.1 Digraph representation of complex system
將復雜系統(tǒng)抽象為有向圖,使設備間的相互作用關系更為清晰,以系統(tǒng)層的健康狀態(tài)為研究目標,對有向圖進行度量,包括節(jié)點的健康狀態(tài)和有向邊的健康狀態(tài)兩大部分。
有向圖中每一個節(jié)點代表單臺設備,按照處理數據是否能夠直接評估設備健康狀態(tài)(或退化狀態(tài)),可以分為直接評估和間接評估兩類[16]。直接評估指的是通過經驗、機理等先驗知識來確認可以直接表征研究對象健康狀態(tài)的變量,通過直接測量這些變量值以及相關的數值特征,實現(xiàn)對所研究對象健康狀態(tài)的評估,例如對于熱敏感設備,可采用溫度變量直接評估設備的健康狀態(tài),傳統(tǒng)的監(jiān)測方法會設置門限閾值,若溫度越限,則視為設備的健康狀態(tài)處于異常(非健康),計算溫度的均值、方差等統(tǒng)計特征,可以用來評估設備健康狀態(tài)的趨勢和穩(wěn)定程度等。該類方法框架如圖2所示,一般情況下,目標對象有多維度的原始監(jiān)測數據,從中識別出與健康狀態(tài)(或退化狀態(tài))直接相關的數據變量,隨著運行時間呈現(xiàn)出單調下降(或上升)的趨勢,此類變量大多數都具有明確的物理含義。
圖2 直接評估方法示意圖Fig.2 Diagram of direct assessment method
當研究對象的健康狀態(tài)變量無法直接測量,或者難以通過先驗知識辨識出哪些變量可以直接反映健康狀態(tài)時,就需要間接地去構建系統(tǒng)健康狀態(tài)評估量。利用研究對象歷史測試數據、試驗數據、全壽命仿真數據和在線狀態(tài)監(jiān)測數據等,結合對象在退化過程中的不同階段,評價各變量對于研究對象健康狀態(tài)的影響關系,挖掘數據之間存在的潛在關系,擬合/回歸出與研究對象退化趨勢相一致的評估量。例如對于機械類系統(tǒng)中的軸承,這種高速轉動類設備的健康狀態(tài)主要取決于結構上的磨損程度,而結構上的損耗、裂紋等變量是無法直接測量到的,需要通過相關的監(jiān)測數據,進行相應的數據變換,挖掘出與退化過程趨勢一致的評估量。由于軸承結構上的磨損會出現(xiàn)不同的振動頻率,此時的振動監(jiān)測數據在幅值上可能仍處于正常范圍內,但在頻域中出現(xiàn)了與以往正常態(tài)相比不同的頻率分量,新頻率分量與退化趨勢一致,則可以作為間接的設備健康狀態(tài)評估量。這類間接評估量往往沒有直接的物理含義,需要借助專家知識進行解釋[16]。間接評估方法的架構如圖3所示。
圖3 間接評估方法示意圖Fig.3 Diagram of indirect assessment method
上述直接評估方法和間接評估方法都是針對單一設備為研究對象,對于復雜系統(tǒng)來說,設備間的相互作用關系也是需要關注的度量對象。本文以有向邊的形式表示這種相互作用關系,以圖1右側的有向圖為例,有向邊e12可以視為節(jié)點v1與節(jié)點v2間的作用關系,其余邊的對應關系詳見表1。由于設備間相互作用的機理模型難以準確建立,本文從數據的角度去構建其健康狀態(tài)評估量。
表1 有向邊對應關系Table 1 Relationship of the directed edges
將系統(tǒng)中設備之間的相互作用視為一種能量流的交互,例如電源系統(tǒng)中傳遞的電流、信息系統(tǒng)中通信的信息流等等,假設這些流在系統(tǒng)正常運行過程中應該遵循特定的動力學模型,當發(fā)生故障或異常情況時,視為系統(tǒng)中的流產生了擾動,偏離原本的運動模式。在這種假設的基礎上,本文通過描述流的模式來表征有向邊的狀態(tài),而流的模式是借助于相應監(jiān)測數據展現(xiàn)出來的,因此對有向邊的所有關聯(lián)數據進行挖掘,發(fā)現(xiàn)其中存在的模式特征,通過分析模式的變化來反映狀態(tài)的變化,進而可以用模式之間的偏差值來評估健康狀態(tài)。
以節(jié)點v1與節(jié)點v2間的有向邊e12為例,設v1點的觀測量記為d1,v2點的觀測量為d2,則有向邊e12對應的觀測量為二維數據集{d1,d2}。聚類方法可以挖掘高維數據集中的模式信息,考慮到工業(yè)領域中設計的復雜系統(tǒng)屬于確定性系統(tǒng),即系統(tǒng)的輸入/輸出特性是根據設計功能而定的,數據通常是因果關系型數據。本文采用時域上直接聚類方法,得到數據在空間中聚集的不同區(qū)域,將這些區(qū)域作為基準模式,然后判斷下一觀測時刻的數據是否仍然聚集于該區(qū)域內,如果落入該區(qū)域中,則認為新狀態(tài)與基準模式對應的狀態(tài)一致;如果新數據偏離了基準模式對應的區(qū)域,則認為存在了某種擾動狀態(tài),使得新狀態(tài)與基準模式相比產生了變化,偏離程度越大,表征狀態(tài)變化程度越劇烈,如圖4所示。
圖4 有向邊評估方法示意圖Fig.4 Diagram of assessment method for the directed edge
這里以航天器能源系統(tǒng)中太陽電池陣和分流調節(jié)器為例進行具體展示。太陽電池陣將接收到的光能轉變?yōu)殡娔芩腿敕至髡{節(jié)器,分流調節(jié)器對產生的電能進行匯聚,并分流掉額外電量,則可以設太陽電池陣為節(jié)點v1,分流調節(jié)器為節(jié)點v2,兩者的拓撲關系同上。對于太陽電池陣,選取其電壓監(jiān)測數據作為觀測量d1;對于分流調節(jié)器,選取其溫度監(jiān)測量作為觀測量d2,圖5為兩個軌道周期的太陽電池陣電壓監(jiān)測數據,圖6為對應的分流調節(jié)器溫度監(jiān)測數據。從這兩幅圖中可以看出,由于航天器軌道特性的影響,設備監(jiān)測數據呈現(xiàn)出周期性變化的模式,單個監(jiān)測量的數據曲線僅能反映出對應單臺設備的監(jiān)測點狀態(tài),建立多監(jiān)測量之間數據模式上的聯(lián)系,可以作為反映多設備間相互作用狀態(tài)的特征量。
圖5 太陽電池陣電壓值Fig.5 Voltage of the solar array
圖6 分流調節(jié)器溫度值Fig.6 Temperature of the shunt regulator
對這兩組一維數據進行直接聚類處理,繪制其在二維空間內的坐標點,結果如圖7所示,可以看出主要分為3類,分別對應航天器入影、陽照/陰影區(qū)工作、出影3種工況,這表明聚類處理可以辨識出數據所蘊含的模式特征。
對于二維空間內的度量,設計一種半徑為r的圓形探測窗口,計算觀測點與探測窗口內包含的檢測點的歐式距離d如式(1)所示:
圖7 聚類結果示意圖Fig.7 Results of clustering
取其中的最小值作為該點的距離值,如圖8所示。
圖8 二維空間內點的度量方法示意圖Fig.8 Diagram of assessment of point in two-dimensional space
在對有向圖中所有節(jié)點與有向邊都進行度量之后,系統(tǒng)層的健康狀態(tài)則是這些度量的融合。設fv和fe分別表征節(jié)點和有向邊的評估量,HS為系統(tǒng)層健康狀態(tài)評估量,則有式(2):
若需要考慮某類設備的重要性時,例如具有多條連接邊的節(jié)點,或具有重要功能的設備節(jié)點,可以通過設置相應權重來表征。
載人航天器是一種典型的復雜系統(tǒng),能源系統(tǒng)是其中最為重要的系統(tǒng)之一,它為所有用電設備提供所需要的功率,是保證整個航天器正常運行的關鍵。為了簡化問題,本文將一種典型的載人航天器能源系統(tǒng)作為一個獨立的系統(tǒng)進行分析。
目前應用于載人航天器的能源系統(tǒng)均采用太陽電池陣-蓄電池模式,其工作原理是航天器在軌道陽照區(qū)時,由太陽電池作為發(fā)電裝置提供電能,并向蓄電池充電;當航天器進入軌道陰影區(qū)時,由蓄電池提供電能。分流調節(jié)器設備將多路太陽電池陣產生的電能進行匯聚,并分流掉額外電量。功率管理器實現(xiàn)能源系統(tǒng)的工作邏輯控制,母線控制單元和供電控制單元共同完成對負載設備通斷電的控制,如圖9所示。
首先將能源系統(tǒng)以有向圖的形式表示出來,如圖10所示,這里僅考慮單路供電控制單元與負載。節(jié)點中標注的數值為該點的度,表示節(jié)點連接的邊的條數,節(jié)點的度可以在一定程度上描述出設備的重要程度。例如節(jié)點D3和D10具有較高的度,其代表的分流調節(jié)器及功率管理器在能源系統(tǒng)中具有十分重要的作用,與工程實際情況相符。
在建立起系統(tǒng)的有向圖模型之后,接下來需要對圖中所有的節(jié)點和有向邊的健康狀態(tài)進行評估??紤]到構建設備的機理模型較為困難,而航天器在運行過程中會采集得到大量遙測數據,這些數據資源蘊含著對應設備的狀態(tài)信息。因此本文采用對遙測數據進行處理的方法來評估所有節(jié)點和有向邊的健康狀態(tài)。
圖9 能源系統(tǒng)示意圖Fig.9 Block diagram of the energy system
由于本文可以獲取到的在軌遙測數據有限,部分遙測數據并不連續(xù),如圖11所示,其中圖(a)為太陽電池陣的供電電壓,對應節(jié)點D1-D2;圖(b)為分流調節(jié)器的溫度,對應節(jié)點D3;圖(c)為放電調節(jié)器的輸出電流,對應節(jié)點D4-D6;圖(d)為放電調節(jié)器的溫度,對應節(jié)點同上;圖(e)為電池的充放電電流,對應節(jié)點D7-D9;圖(f)為母線電壓,對應節(jié)點D10-D13。
圖10 能源系統(tǒng)有向圖Fig.10 Digraph of the energy system
圖11 可使用遙測數據資源Fig.11 Accessible telemetry data resources
在確定所有可用監(jiān)測數據之后,對每個節(jié)點及每條邊的相關監(jiān)測量進行聚類,繪制其在高維空間中聚集情況,挖掘出存在的模式特征,并將聚類結果整理為矩陣的形式,如圖12所示。其中對角線為各節(jié)點的處理結果,有向邊處理結果的位置與矩陣坐標相一致,例如D1與D3之間的有向邊處理結果位于對應的第2行第1列。這里為了簡化問題,將節(jié)點D1、D2視為同狀態(tài),將節(jié)點D4、D5、D6視為同狀態(tài),將節(jié)點 D7、D8、D9視為同狀態(tài),矩陣結果是一個下三角陣。
圖12 聚類結果示意圖Fig.12 Results of data clustering
在得到聚類結果之后,就可以對后續(xù)新觀測時刻的數據進行分析,判斷新觀測數據是否落入聚類處理得到的已有模式中。設一個新的監(jiān)測時間 點 ti, 含 有 13 個 分 量: [M1(ti),M2(ti),…M13(ti)],代入公式(1)計算各分量的偏差值,作為對各設備及設備間相互作用的健康狀態(tài)評估量,結果如圖13(a)所示,其中橫坐標為時間t,縱坐標為用以度量偏差量的歐式距離值d。最后融合所有分量,得到系統(tǒng)層的健康狀態(tài)評估量,如圖13(b)所示,坐標含義同上。從計算得到的健康狀態(tài)評估量可以看出,曲線呈現(xiàn)出平穩(wěn)的趨勢,這與數據對應的航天器實際工況相符??梢詫⑦@種平穩(wěn)模式作為系統(tǒng)健康的基準,計算后續(xù)觀測時刻的模式特征與健康基準之間的偏差量,作為該觀測時刻狀態(tài)偏離健康基準的評估量。由于缺少故障樣本數據和性能退化樣本數據,這里僅對平穩(wěn)工況下的航天器能源系統(tǒng)健康狀態(tài)進行了評估。
圖13 系統(tǒng)狀態(tài)評估結果示意圖Fig.13 Results of system health state assessment
本文以大型載人航天器對系統(tǒng)高可靠性、高安全性需求為研究背景,圍繞健康狀態(tài)評估方法展開研究,針對實際工程需求,提出了一種新的系統(tǒng)健康狀態(tài)評估方法:
1)用有向圖的形式來描述系統(tǒng)的結構特性,將對系統(tǒng)健康狀態(tài)評估轉化為對有向圖各個元素的度量;突出系統(tǒng)中成分之間的相互作用關系,使得最終評估結果能夠更完整地體現(xiàn)出系統(tǒng)層的健康狀態(tài)。
2)采用數據聚類的方法識別監(jiān)測數據中的模式,通過計算不同時刻數據模式的偏差,來反映系統(tǒng)健康狀態(tài)的變化,這種通過數據驅動建立的方法,可以避免復雜的機理建模帶來的問題,適用于對大規(guī)模、復雜程度高的系統(tǒng)進行應用。