袁利,王淑一,*
1. 北京控制工程研究所,北京 100094 2.空間智能控制技術(shù)重點實驗室,北京 100094
近年來,以機器學習為代表的新一代人工智能技術(shù)在農(nóng)業(yè)、醫(yī)療、教育等眾多領(lǐng)域獲得了成功應用[1]。為搶占戰(zhàn)略制高點,各航天強國也都推出了“人工智能+航天”的國家政策[2-4]:美國于2019年頒布了《美國人工智能倡議》,旨在確保其人工智能技術(shù)在航空航天等領(lǐng)域的優(yōu)勢地位;法國于2018年發(fā)布了《法國人工智能發(fā)展戰(zhàn)略》,旨在包括航天在內(nèi)的優(yōu)勢行業(yè)中開展人工智能技術(shù)的廣泛應用;日本于2017年發(fā)布了《航天產(chǎn)業(yè)展望2030》,確立了基于人工智能技術(shù)的航天產(chǎn)業(yè)未來發(fā)展方向;中國正處于從航天大國走向航天強國的關(guān)鍵階段,在此階段國務院發(fā)布了《新一代人工智能發(fā)展規(guī)劃》,將發(fā)展人工智能技術(shù)上升到國家戰(zhàn)略層面,并明確指出到2030年人工智能理論、技術(shù)與應用要在總體達到世界領(lǐng)先水平。
結(jié)合未來航天器的研制需求和人工智能技術(shù)的發(fā)展趨勢,構(gòu)建了一種航天器智能自主控制系統(tǒng)的新型通用架構(gòu)[5],主要包括:感知、決策、操控和健康管理4個部分,具體如圖1所示。從該圖中可以看出:對于該新型通用架構(gòu)而言,健康管理作為一個獨立的智能模塊,基于其與決策、操控和感知模塊之間的信息交互,通過建立航天器的狀態(tài)特征與異常征兆之間的映射關(guān)系,來實現(xiàn)故障預警;通過構(gòu)建“正常到異常到失效”的故障演化模型,來實現(xiàn)故障診斷和壽命評估。
圖1 航天器智能自主控制系統(tǒng)的新型通用架構(gòu)[5]Fig.1 General architecture of new intelligent autonomous spacecraft control systems [5]
健康管理作為航天器實現(xiàn)智能自主控制亟待突破的關(guān)鍵技術(shù)之一,是從系統(tǒng)層面克服產(chǎn)品固有可靠性不足、提升航天器安全可靠穩(wěn)定運行能力的有效手段?;谇捌谝呀⒌暮教炱髦悄茏灾骺刂葡到y(tǒng)新架構(gòu),本文重點關(guān)注基于人工智能的航天器控制系統(tǒng)健康管理技術(shù)現(xiàn)狀與發(fā)展趨勢:首先,根據(jù)現(xiàn)有航天型號設計、研制和在軌的具體情況,梳理出航天器控制系統(tǒng)健康管理技術(shù)所面臨的挑戰(zhàn)性問題;然后,分別從故障預警、故障診斷和壽命評估3個方面,詳細闡述健康管理技術(shù)的研究現(xiàn)狀及其在航天領(lǐng)域的具體應用情況;最后,提煉出基于人工智能的航天器控制系統(tǒng)健康管理技術(shù)未來發(fā)展方向。
目前,航天器控制系統(tǒng)的健康管理技術(shù),可以概括為“硬件備份+解析冗余+專家支持+安全模式”[5]。然而,近幾年來國內(nèi)外多次出現(xiàn)的由于控制分系統(tǒng)故障而導致航天器業(yè)務中斷、甚至整器完全失效的嚴重事件表明:現(xiàn)有健康管理技術(shù)與航天器安全可靠穩(wěn)定運行需求之間的差距較大。根據(jù)健康管理技術(shù)的定義內(nèi)涵[6],本節(jié)分別從故障預警、故障診斷和壽命評估3個方面,梳理出來航天器控制系統(tǒng)所面臨的挑戰(zhàn)。
航天器控制系統(tǒng)的故障預警技術(shù),能夠提取微小故障的特征信息,對系統(tǒng)未來可能發(fā)生的故障進行預測,在故障發(fā)生之前給出報警,采取適當?shù)奶幹貌呗赃M行及時干預,盡量使故障不擴大、不擴散,有效避免航天器任務的間斷,最大限度發(fā)揮航天器能力。因此,故障預警技術(shù)是實現(xiàn)控制系統(tǒng)健康管理、確保航天器安全穩(wěn)定運行的重要前提;其目的在于:“提前發(fā)現(xiàn)征兆、適時維保系統(tǒng)、確保業(yè)務連續(xù)”。
雖然故障預警的方法研究和技術(shù)應用均有了快速發(fā)展,但針對航天器控制系統(tǒng)的閉環(huán)特性和強不確定性、數(shù)據(jù)的強耦合性和多樣性,現(xiàn)有故障預警技術(shù)在實際工程應用方面尚存在以下不足:
1) 現(xiàn)有基于時間序列、卡爾曼濾波等預警技術(shù),難以應對閉環(huán)和強耦合特性,無法綜合考慮姿態(tài)、軌道、環(huán)境等多維參數(shù),并從中準確提取微小故障的隱性特征,這導致故障初期的征兆難以被有效提取和及時發(fā)現(xiàn),一旦發(fā)現(xiàn)異常,則故障已經(jīng)演化到了一定程度,留給故障預警的提前時間量較短。
2) 基于因果關(guān)系的預警防范措施,難以處理強不確定性數(shù)據(jù),且難以融合考慮研制、測試和在軌的多源數(shù)據(jù),數(shù)據(jù)信息使用不全導致故障預警結(jié)果的準確性低,極易造成漏警和誤警。
航天器控制系統(tǒng)的故障診斷技術(shù),能夠快速檢測并準確定位故障源,為后續(xù)的系統(tǒng)重構(gòu)和容錯控制決策實施提供依據(jù),以期在故障發(fā)生之后,采取合理可行的措施,通過花費最小代價來最大程度地恢復系統(tǒng)的既定功能與性能。因此,故障診斷技術(shù)是實現(xiàn)控制系統(tǒng)健康管理、確保航天器安全穩(wěn)定運行的關(guān)鍵核心;其目的在于“準確定位故障、采取合理措施、輔助重構(gòu)決策”。
現(xiàn)有成熟的故障診斷技術(shù)方法集中于基于模型和信號處理這兩類,但在數(shù)據(jù)利用率和在軌適應性方面仍存在以下不足:
1) 僅根據(jù)在軌故障表象進行故障診斷,沒有充分利用專家知識以及產(chǎn)品研制、測試的數(shù)據(jù),尚未深入挖掘和利用各階段的歷史數(shù)據(jù)。事實上,航天器的在軌表現(xiàn)與其在研制過程和地面測試過程的表現(xiàn)息息相關(guān),在歷史數(shù)據(jù)中蘊含了大量反映健康狀態(tài)的規(guī)律、知識和特征,是客觀反映運行狀態(tài)的重要依據(jù)。
2) 難以根據(jù)環(huán)境和任務的變化來自適應地調(diào)整故障診斷策略,現(xiàn)有的措施一般都是根據(jù)地面的測試結(jié)果來設定閾值,不具備在軌自主更新診斷參數(shù)的能力。由于地面測試階段與在軌真實運行的環(huán)境和數(shù)據(jù)都存在差異,導致即使地面充分驗證過的技術(shù)方法,實際在軌使用中也未必有效。
航天器控制系統(tǒng)的壽命評估技術(shù),能夠根據(jù)當前航天器的實際在軌運行狀態(tài),構(gòu)建出“正常到異常到失效”的故障演化模型,進而可以提前預知航天器的在軌剩余服役時間,為后續(xù)任務調(diào)整、重構(gòu)方案實施、離軌策略制定等提供科學依據(jù)。因此,壽命評估技術(shù)是實現(xiàn)航天器健康管理、確保安全穩(wěn)定運行的重要手段;其目的在于:“預測剩余壽命、提前制定預案、擇機離軌替換”。
現(xiàn)有其他領(lǐng)域較為成熟的壽命評估方法在航天器控制領(lǐng)域的實際應用效果不佳,這主要體現(xiàn)在:
1) 基于物理失效模型的壽命評估方法,不能同時兼顧突發(fā)失效和性能退化2種失效模式。航天器控制系統(tǒng)的壽命終止,主要有2種表現(xiàn)形式:一是功能突發(fā)失效,由于部件存在失效概率,部件的失效將導致控制分系統(tǒng)突發(fā)功能失效;二是性能嚴重退化,雖然部件正常工作,但其性能逐漸退化,引起控制分系統(tǒng)某些性能指標低于任務所需閾值。現(xiàn)有的研究成果大多以上述失效形式中的某一種具體情況作為判據(jù),尚未將兩種形式結(jié)合起來開展壽命評估研究。
2) 基于數(shù)據(jù)驅(qū)動的壽命評估方法,未充分挖掘多源數(shù)據(jù)和相似樣本信息。現(xiàn)有研究成果表明:一方面,交變的在軌空間環(huán)境溫度是引起航天器控制系統(tǒng)關(guān)鍵部件性能退化的一個重要因素;遙測數(shù)據(jù)能夠真實反映系統(tǒng)在軌實時運行狀態(tài)和性能變化過程。另一方面,控制系統(tǒng)的研制、測試和試驗等數(shù)據(jù),以及同類型系統(tǒng)在軌運行、退役的壽命信息,對于研究當前系統(tǒng)剩余壽命能夠提供重要的信息支持?,F(xiàn)有方法尚未充分挖掘上述多源數(shù)據(jù)中隱含的有效信息,再加上統(tǒng)計控制系統(tǒng)壽命的數(shù)據(jù)極少,導致現(xiàn)有方法難以直接應用于航天器控制系統(tǒng)。
本節(jié)重點從研究現(xiàn)狀和技術(shù)應用2個維度,分別對故障預警、故障診斷和壽命評估3個方面的國內(nèi)外現(xiàn)狀進行分析和歸納。
2.1.1 故障預警技術(shù)的研究現(xiàn)狀
根據(jù)實現(xiàn)機理的不同,現(xiàn)有故障預警技術(shù)主要分為基于模型和數(shù)據(jù)驅(qū)動2種。
基于模型的故障預警技術(shù),通過定性描述和定量表達的方式來建立研究對象失效機理的數(shù)學模型,并考慮物理實現(xiàn)過程和各部件之間的相互作用,從機理實現(xiàn)的角度來深入分析故障特性、預測系統(tǒng)的未來狀態(tài)。相對于其他領(lǐng)域,以航天器控制系統(tǒng)為對象,開展部件和系統(tǒng)級故障預警技術(shù)研究的相關(guān)成果較少:文獻[7]以動量輪為研究對象,考慮金屬磨損、保持架磨損、潤滑劑損失等影響因素,建立了基于隨機閾值的Gauss-Brown失效物理模型,并以該模型為基礎對動量輪的運行狀態(tài)進行評估分析,進而得到符合工程實際的故障預警結(jié)果;類似的,文獻[8]以近十年的運行數(shù)據(jù)為基礎,重點考慮潤滑劑的影響,建立了動量輪的退化模型,實現(xiàn)了故障的提前預警;文獻[9]考慮了故障的傳播規(guī)律,基于有向圖建立了航天器控制系統(tǒng)的故障預測模型,并通過系統(tǒng)節(jié)點保留的技術(shù)手段,在預警精度保持不變的前提下,有效提升了故障預警的效率。由于航天器控制系統(tǒng)屬于典型的機電類復雜系統(tǒng),其實際物理特性具有極強的耦合性和隨機性,難以完全建立該復雜系統(tǒng)的物理模型,這使得基于模型的故障預警技術(shù)在實際航天型號應用中受到較大限制[10]。
基于數(shù)據(jù)驅(qū)動的故障預警技術(shù),通過挖掘歷史數(shù)據(jù)、系統(tǒng)狀態(tài)、故障征兆與工作環(huán)境之間的內(nèi)在聯(lián)系,建立相應變量之間的映射關(guān)系,從而利用數(shù)據(jù)對系統(tǒng)狀態(tài)進行估計和預測?;跀?shù)據(jù)驅(qū)動的故障預警技術(shù),其理論研究最為廣泛,主要包括[11-17]:灰色聚類理論、貝葉斯網(wǎng)絡、神經(jīng)網(wǎng)絡、Petri網(wǎng)、支持向量機和時間序列分析等。航天器控制系統(tǒng)故障預警技術(shù)的代表性成果,主要包括:文獻[18]以半球諧振陀螺為研究對象,將灰色聚類理論與支持向量機進行有機結(jié)合,建立了一種殘差修正的自回歸灰色模型,能夠有效提升故障預警的時效性;文獻[19]結(jié)合粒子群優(yōu)化(PSO)與支持向量機(SVR)兩種技術(shù),構(gòu)建了一種基于PSO-SVR的航天器健康狀態(tài)趨勢預測新方法;文獻[20]以航天器控制系統(tǒng)為對象,提出了一種基于改進近鄰保持嵌入的故障預警方法,該方法能夠根據(jù)樣本點的鄰域密度來動態(tài)地調(diào)整鄰域參數(shù)的取值,同時結(jié)合指數(shù)加權(quán)移動平均控制圖來累積歷史故障信息,能夠有效提升其對微小故障的敏感程度,進而實現(xiàn)故障預警。
目前,NASA已將相關(guān)故障預警技術(shù)固化成多款軟件工具[21],比如ORCA和IMS,對國際空間站中控制力矩陀螺的故障進行了預警,并準確識別出了失效的早期征兆;同時,歐洲航天局(ESA)也開發(fā)了DrMUST軟件,系統(tǒng)地對某型號航天器的飛行數(shù)據(jù)進行了分析,檢查其狀態(tài)是否異常,通過隱性狀態(tài)的準確識別找出了異常數(shù)據(jù)模式,并通過相應處置手段,預防異常狀態(tài)再次發(fā)生[22]。
隨著深度學習理論方法的不斷突破,該技術(shù)已逐步嘗試被引入到故障預警的研究領(lǐng)域。深度學習技術(shù)的實質(zhì)是:通過建立多隱層網(wǎng)絡模型,利用海量訓練數(shù)據(jù)來學習并提取更加有用的故障特征,從而提升故障預警結(jié)果的精確度;具有代表性的研究成果[23]:Elsaid等利用深度學習技術(shù)中的長短時記憶網(wǎng)絡,來預測航空發(fā)動機的振動,成功預測了未來5~20 s內(nèi)的振動值,實現(xiàn)了因振動值變化而引起的系統(tǒng)級故障預警。由于深度學習技術(shù)具有強大的學習和特征提取能力,能夠識別出微小故障的前期征兆特性,是未來航天器控制系統(tǒng)故障預警技術(shù)發(fā)展的一個重要方向。
2.1.2 故障預警技術(shù)的應用情況
故障預警技術(shù)在航天領(lǐng)域的典型應用案例,主要包括:
1) 美國:開發(fā)了航天領(lǐng)域的第1套功能較為完善的基于分粒度建模和多模推理的航天器趨勢分析系統(tǒng)(AMTAS)[24];對包括控制系統(tǒng)在內(nèi)的多個分系統(tǒng)遙測數(shù)據(jù)進行自動趨勢分析,以避免潛在問題發(fā)生,并修復檢測到的故障。AMTAS的擴展升級版本是“監(jiān)視和自治調(diào)整系統(tǒng)”,該系統(tǒng)從硬件的健康和安全管理擴展到動態(tài)應用,使用機器學習方法來處理趨勢分析問題中的不確定性,減少計算復雜度。
2) 歐洲:瑞典空間物理學院研制了衛(wèi)星異常分析和預測系統(tǒng)(SAAPS)[25];其異常狀態(tài)預測模型由神經(jīng)網(wǎng)絡在指定的異常狀態(tài)數(shù)據(jù)集中訓練得到,對控制系統(tǒng)等故障預警的準確率大于70%,能夠給出預警的可信度。意大利的VITROCISET公司為歐盟發(fā)射的XMM-Newton科學探測衛(wèi)星專門開發(fā)了一個交互式遙測數(shù)據(jù)分析工具[26];通過對控制系統(tǒng)等分系統(tǒng)的遙測數(shù)據(jù)進行分析,能夠確認遙測數(shù)據(jù)的偏差、判定設備惡化的運行模式,檢測和隔離整星及各分系統(tǒng)設備的故障,進而確保航天器健康狀態(tài)、延長在軌壽命。
3) 日本:在HAYABUSA衛(wèi)星上部署了第3代的監(jiān)視和診斷專家系統(tǒng)ISACS-DOC[27],該系統(tǒng)的主要工作就是監(jiān)視、預測整星及控制、電源等分系統(tǒng)的健康狀況,為不具備可靠處理運行過程問題的用戶提供輔助操作,并提供航天器運行的參數(shù)、狀態(tài)、趨勢等顯示,以確保航天器安全運行,減少運行風險。
4) 中國:利用控制力矩陀螺(CMG)和動量輪等執(zhí)行機構(gòu)在不同階段的數(shù)據(jù),通過多源異構(gòu)數(shù)據(jù)的有機融合,基于深度神經(jīng)網(wǎng)絡已開展了故障演化規(guī)律的建模研究工作,能夠在地面實現(xiàn)航天器控制系統(tǒng)執(zhí)行機構(gòu)微小緩變故障的提前預警。
2.2.1 故障診斷技術(shù)的研究現(xiàn)狀
從20世紀70年代開始,航天器控制系統(tǒng)故障診斷技術(shù)一直備受國內(nèi)外廣大科研學者的重視[28-34]。相對于故障預警與壽命評估技術(shù)的發(fā)展,航天器故障診斷技術(shù)的發(fā)展歷程最長、研究成果最多。
按照實現(xiàn)機理的不同,故障診斷技術(shù)可以分為以下3類[35-38]:基于解析模型、信號處理和人工智能。其中,基于解析模型的故障診斷技術(shù),是最先發(fā)展起來的,該技術(shù)充分利用了航天器控制系統(tǒng)的動力學和運動學型模型,能夠從影響機理的層面給出準確的故障檢測與隔離結(jié)果;由于不可避免的建模誤差、未知擾動及環(huán)境噪聲等多種因素的耦合影響,這對診斷算法的魯棒性提出了極高要求;采用的主要研究方法包括[39-57]:基于觀測器、基于濾波器、等價空間和集員估計等;具有特色的研究成果有:文獻[49]利用高階滑模濾波器對于系統(tǒng)不確定性的強魯棒能力,設計了一種適用于陀螺和推力器故障的診斷方法,并將其用于ESA“Mars Express”火星探測衛(wèi)星的型號任務中;文獻[52,56]以系統(tǒng)故障診斷能力的定性判定和定量表達為突破口,基于提出的可診斷性理論,將工作重點前移至系統(tǒng)設計階段,解決了航天器控制系統(tǒng)自主故障診斷所面臨的基礎性難題。
基于信號處理的故障診斷技術(shù),利用系統(tǒng)輸出與故障源之間存在的關(guān)聯(lián)關(guān)系(主要包括:幅值、相位、頻率與相關(guān)性)來檢測和隔離故障,原理實現(xiàn)簡單、動態(tài)實時性好,但對潛在故障的診斷準確性不高。采用的主要研究方法包括[58-60]:小波分析和經(jīng)驗模態(tài)分解(EMD)等。其中,文獻[58]針對紅外地球敏感器的輸出均值階躍突變故障、陀螺的常值漂移階躍變化故障、姿控發(fā)動機的堵塞和泄漏故障,利用多種小波變換技術(shù)手段,有效提升了故障診斷的性能。
基于人工智能的故障診斷技術(shù),利用系統(tǒng)各變量之間存在的模糊邏輯、建立的因果模型、制定的專家規(guī)則以及確定的故障征兆案例等,來獲得故障診斷模型;在此基礎上,通過模仿人類在整個診斷過程中的思維方式和行為舉措,來自動實現(xiàn)故障診斷功能?,F(xiàn)階段,基于人工智能的故障診斷技術(shù)是航天器健康管理領(lǐng)域發(fā)展的重點和熱點,可細分為[61-77]:基于知識、神經(jīng)網(wǎng)絡、定性模型和數(shù)據(jù)挖掘的智能故障診斷技術(shù)。其中,基于知識和神經(jīng)網(wǎng)絡是人工智能故障診斷技術(shù)的重要分支,其基本思路分別是:匯總該領(lǐng)域長期的實踐經(jīng)驗和大量的故障信息,模仿專家的推理方式,并將其總結(jié)提煉成計算機能夠識別的規(guī)則知識庫;在此基礎上,將需要診斷的實時數(shù)據(jù)與已生成的規(guī)則知識庫進行分析和推理,從而推算出是否發(fā)生故障以及故障發(fā)生的可能位置;使用歷史數(shù)據(jù)來訓練分類器,通過對比實測值與分類器之間的差異特性,實現(xiàn)故障的檢測與定位。具有代表性的研究成果包括:文獻[62]設計了一種適用于某類型衛(wèi)星的地面檢測及飛行狀態(tài)地面監(jiān)測的實時故障診斷專家系統(tǒng)(SCRDES),該系統(tǒng)通過總結(jié)原理性、結(jié)構(gòu)性知識和專家經(jīng)驗型知識,采用深、淺層知識的混合摸型并基于引入特征量及其動態(tài)屬性的概念,實現(xiàn)了衛(wèi)星姿態(tài)控制系統(tǒng)閉環(huán)特性的有效動態(tài)表達,在此基礎上,采用數(shù)據(jù)處理與知識處理并行工作的系統(tǒng)結(jié)構(gòu),實現(xiàn)了在線實時故障診斷;文獻[70]針對閉環(huán)航天器控制系統(tǒng)中執(zhí)行機構(gòu)的微小故障,提出了一種聯(lián)合觀測器和神經(jīng)網(wǎng)絡的故障檢測和隔離方法,該方法首先基于模型的故障診斷方法,實現(xiàn)外部干擾和故障的解耦,然后利用神經(jīng)網(wǎng)絡進一步減少剩余的外部干擾、模型不確定性影響,通過設計決策邏輯,成功檢測出執(zhí)行機構(gòu)的微小故障。
基于定性模型的智能故障診斷技術(shù),根據(jù)系統(tǒng)結(jié)構(gòu)與組件之間的連接關(guān)系或是各參數(shù)之間的依賴關(guān)系,建立診斷系統(tǒng)的結(jié)構(gòu)、行為或功能模型;在此基礎上,通過定性推理技術(shù)得到系統(tǒng)在正常情況下模型的預測行為,并通過其與系統(tǒng)的實際行為比對,獲取系統(tǒng)的異常征兆;最后,在系統(tǒng)模型中搜索各種可能行為的狀態(tài)假設,使得預測行為與實際行為一致,從而找到偏離正常行為的狀態(tài)假設(系統(tǒng)的故障源)。具有代表性的研究成果包括:文獻[73]針對航天器星上資源有限、推進系統(tǒng)在軌測量參數(shù)少的特點,提出了一種動態(tài)故障診斷方法,利用符號有向圖(SDG)模型的完備性以及故障隨時間的傳播特性,有效提升了“DFH”衛(wèi)星推進系統(tǒng)的故障診斷分辨率。
基于數(shù)據(jù)挖掘的智能故障診斷技術(shù),通過對海量的歷史數(shù)據(jù)進行處理來獲得系統(tǒng)的行為模型;在此基礎上,利用先驗知識來及時發(fā)現(xiàn)并準確定位故障。具有代表性的研究成果包括:文獻[74]針對航天器控制系統(tǒng)的陀螺故障檢測與辨識問題,首先采用閾值法進行故障檢測,然后提出了一種基于獨立分量分析(ICA)的故障辨識算法,該算法利用混合矩陣的相關(guān)系數(shù)和先驗信息,克服了傳統(tǒng)ICA的模糊性,提升了辨識精度;文獻[75]提出了一種新穎的模糊C均值方法(KFCM),利用該方法的無監(jiān)督學習特性,能夠有效診斷動量輪的已知和未知故障模式,與有監(jiān)督學習的數(shù)據(jù)挖掘方法(例如,傳統(tǒng)的神經(jīng)網(wǎng)絡方法)相比,具有明顯優(yōu)勢。
根據(jù)現(xiàn)有技術(shù)的調(diào)研情況可知,與機器學習、智能決策等新一代人工智能技術(shù)相結(jié)合,已成為目前智能故障診斷的技術(shù)研究熱點[76-78]。
2.2.2 故障診斷技術(shù)的應用情況
故障診斷技術(shù)在航天領(lǐng)域的典型應用案例,主要包括:
1) 美國:自由號空間站研制了姿態(tài)確定與控制系統(tǒng)的維護與診斷系統(tǒng)(MDS)[79],分為在線系統(tǒng)和離線推理系統(tǒng)2個部分。在線系統(tǒng),嵌入到自由號空間站的姿態(tài)確定與控制系統(tǒng)中,主要用于實現(xiàn)數(shù)據(jù)收集、數(shù)據(jù)壓縮、數(shù)據(jù)傳輸和簡單的推理;離線推理系統(tǒng),主要分為3個模塊,即故障診斷模塊、預測模塊和輔助維修模塊。其中,故障診斷模塊,主要包括診斷推理器和恢復專家器兩部分;診斷推理器,采用了人工智能技術(shù)(主要包括:模式比較、啟發(fā)式分類、基于歷史信息、符號推理和基于模型推理等)來診斷故障源和評價該故障對其它部件的影響,其中最關(guān)鍵的技術(shù)就是基于模型的推理方法?;謴蛯<移鳎軌蛑贫ㄖ荚谂懦收系姆桨浮ivingstone軟件利用系統(tǒng)行為和內(nèi)部結(jié)構(gòu)模型(組件連接模型、轉(zhuǎn)換模型和行為模型)來實現(xiàn)故障診斷[6, 71]。該軟件結(jié)合沖突指向搜索和快速命題推理等算法,消除了人工智能中演繹和反推之間的矛盾,實現(xiàn)了快速的搜索和推理。該軟件已成功應用于“深空一號”探測器、“X-37”飛行器和“Earth Observing One”任務,使航天器具備了自主故障診斷與系統(tǒng)重構(gòu)的能力。
2) 歐洲:SPOT-1衛(wèi)星采用了自主監(jiān)控、故障檢測和重構(gòu)技術(shù)[30, 80]。其中,姿態(tài)控制系統(tǒng)自主完成的檢測分為2類:一類是技術(shù)檢驗,包括標準檢驗(與電壓、溫度等參數(shù)有關(guān))和特殊檢驗;一類是功能檢驗,包括單個部件專用的推斷檢驗、冗余配置部件的一致性檢驗、不同部件輸出量之間的相關(guān)性檢驗3個子類。SMART-1月球探測器中故障診斷與重構(gòu)系統(tǒng)的目標是[81]:在與地面通訊長期中斷的情況下,維持該探測器的正常任務運行;當發(fā)生故障時,能使得控制等分系統(tǒng)自主診斷故障,并通過切換備份部件或切換其他可選操作模式來自主進行功能恢復,不影響正常業(yè)務。具體而言,當單個部件故障時,通過局部冗余配置處理;當分系統(tǒng)或系統(tǒng)級發(fā)生故障時,通過多部件重構(gòu)或工作模式切換來處理。一旦影響到系統(tǒng)安全性,探測器將切換到安全模式,在沒有地面聯(lián)系的情況下存活兩個月,直到地面操作介入。
3) 日本:在GEOTAIL衛(wèi)星中研制了ISACS-DOC軟件,其包含了一個具有500個診斷規(guī)則的數(shù)據(jù)庫,依據(jù)這些規(guī)則即可快速分析衛(wèi)星狀態(tài),它的著眼點是“異常診斷”,即采用了概率診斷方法,按發(fā)生異常的概率由高至低依次提示若干種可能發(fā)生的異常及其原因。這種方法能夠?qū)⒖蓪е庐惓5闹饕虮容^全面地提示給地面應用人員;在此基礎上,通過升級換代,ISACS-DOC軟件又應用于“隼鳥號”深空探測器中,這也是最具代表性、最新型的在軌異常監(jiān)測與診斷系統(tǒng),主要解決深空探測航天器通信時間延遲以及監(jiān)測、診斷可用信息量少的問題[27]。
4) 中國:目前已在一些型號的飛行試驗任務中,采用了故障診斷和系統(tǒng)重構(gòu)等智能化技術(shù),并收到了良好效果[82]。近幾年來,利用各種離線和在線數(shù)據(jù),已開展了基于人工智能的航天器控制系統(tǒng)故障診斷技術(shù)的研究工作,設計了決策樹與深度學習相結(jié)合的診斷網(wǎng)絡,能夠有效提升故障診斷的精度和適應性。
2.3.1 壽命評估技術(shù)的研究現(xiàn)狀
按照研究對象等級的不同,壽命評估技術(shù)一般可以分為2類,即系統(tǒng)級和部件級。目前,壽命評估技術(shù)的研究成果多集中于部件級;又可以細分為[83-91]:基于失效機理模型、基于數(shù)據(jù)驅(qū)動和基于混合模型3種。
基于失效機理模型的壽命評估技術(shù),是對部件的性能特征進行分析,并根據(jù)其性能退化特征建立相應的數(shù)學模型;基于該模型,對部件的退化演變趨勢和剩余使用壽命進行評估與分析。具有代表性的研究成果包括:文獻[85]基于維納退化模型,提出了一種基于期望最大化(EM)算法的動量輪可靠性建模和壽命評估方法,該方法通過失效模式、機理和影響分析,建立了具有隨機效應的維納過程退化模型;進而,利用第一次碰撞時間來描述失效時間,并根據(jù)維納退化模型推導出可靠性函數(shù)的顯式結(jié)果;最后,利用EM算法來獲取該可靠性函數(shù)的最大似然估計量。
基于數(shù)據(jù)驅(qū)動的壽命評估技術(shù),無需研究設備的失效機理,僅通過設備的監(jiān)測數(shù)據(jù)或歷史數(shù)據(jù),運用概率統(tǒng)計、數(shù)據(jù)挖掘等相關(guān)技術(shù)完成預測和評估等功能。具有代表性的研究成果包括:文獻[87]針對具有多退化變量的陀螺壽命預測問題,提出了一種基于Copula函數(shù)的系統(tǒng)剩余壽命預測方法,該方法利用陀螺漂移系數(shù)樣本的標準差數(shù)據(jù)波動性隨時間遞增特性,建立了方差時變的正態(tài)隨機過程退化模型,得到了陀螺剩余壽命的邊緣分布函數(shù);進而,基于Copula函數(shù)對各退化變量之間的相關(guān)性進行融合并得到聯(lián)合分布函數(shù),實現(xiàn)了陀螺剩余壽命的有效評估。
基于混合模型的壽命評估技術(shù),通過將不同模型進行組合(包括:歷史數(shù)據(jù)與物理模型),建立不同模型、數(shù)據(jù)以及數(shù)據(jù)與模型之間的函數(shù)關(guān)系來完成壽命評估。具有代表性的研究成果包括:文獻[91]提出了一種用于混合壽命評估方法,該方法將最小二乘支持向量回歸(LSSVR)和隱馬爾可夫模型(HMM)2種方法進行結(jié)合;其基本思路是:從傳感器信號中提取特征,用于訓練代表不同健康水平的HMM;LSSVR算法用于預測特征趨勢;根據(jù)每個HMM的概率,確定未來的健康狀態(tài),并對剩余壽命進行有效評估。
系統(tǒng)級壽命評估的研究思路,具體分為2種:① 將完整系統(tǒng)的壽命評估轉(zhuǎn)化為關(guān)鍵脆弱部件的壽命評估;② 直接對完整系統(tǒng)進行壽命評估。主要研究方法包括[92-96]:Petri網(wǎng)、動態(tài)故障樹(DFT)、隨機混雜自動機(SHA)等。具有代表性的研究成果包括:文獻[92]引入了退化狀態(tài)/局部失效的概念,全面分析了不同失效對系統(tǒng)的影響,并考慮了不同失效的嚴重程度,利用Kaplan-Meier估計器來估計不同狀態(tài)之間的轉(zhuǎn)移概率;在此基礎上,基于上述狀態(tài)和轉(zhuǎn)移概率,構(gòu)建了Petri網(wǎng)模型,可以有效評估航天器控制系統(tǒng)的剩余壽命。
相比于部件級壽命評估,系統(tǒng)級壽命評估技術(shù)的研究還處于發(fā)展階段;事實上,開展系統(tǒng)級壽命評估技術(shù)方法的研究,更有實際意義且更具有挑戰(zhàn)性。
2.3.2 壽命評估技術(shù)的應用情況
壽命評估技術(shù)在航天領(lǐng)域的典型應用案例,主要包括[86]:美國霍尼韋爾公司通過測量航天器控制系統(tǒng)中陀螺部件的激光強度和讀出強度,導出了每個模式下的電壓以及相關(guān)參數(shù),將最近1 000 h 的性能數(shù)據(jù)進行預定的多項式擬合,進而能夠根據(jù)預定的臨界工作溫度來生成壽命性能特性數(shù)據(jù),從而外推并預測出航天器控制系統(tǒng)中關(guān)鍵部件——激光陀螺的剩余壽命。Failure Analysis公司在EUVE衛(wèi)星壽命評估工作中,采用了統(tǒng)計模式識別方法來確定系統(tǒng)的失效征兆,并基于歷史失效記錄成功預測了控制等各分系統(tǒng)中相關(guān)部件的剩余壽命。
中國針對某型號動量輪軸承的潤滑失效機理進行了研究,并對潤滑劑的損耗和微循環(huán)進行了分析及建模,進而對該動量輪的軸承進行了壽命預測[93]。近幾年來,已從部件突發(fā)失效與系統(tǒng)性能退化兩種失效形式出發(fā),挖掘了隱含在高維海量歷史數(shù)據(jù)中的健康特征,研究了數(shù)據(jù)驅(qū)動和退化機理相結(jié)合的航天器控制系統(tǒng)動態(tài)剩余壽命預測技術(shù)。
針對上述的挑戰(zhàn)問題和研究現(xiàn)狀,本節(jié)分別提煉了故障預警、故障診斷和壽命評估3個方面亟需突破的理論方法和關(guān)鍵技術(shù);在此基礎上,構(gòu)建數(shù)字孿生的原型系統(tǒng),在地面等效模擬在軌航天器的工作狀況,并基于在軌遙測數(shù)據(jù)實現(xiàn)健康管理方法的協(xié)同進化。
1) 多源高維數(shù)據(jù)融合的故障預警技術(shù)
目前,故障預警技術(shù)在航天領(lǐng)域的應用并不廣泛,其主要原因有2個方面:一方面,現(xiàn)有技術(shù)主要適用于低維數(shù)據(jù)、單因素影響的情況;對于航天器而言,其運行狀態(tài)往往綜合反映在多維遙測數(shù)據(jù)中,且受到高低溫、輻照、應力等復雜空間環(huán)境影響;另一方面,航天產(chǎn)品在軌失效的樣本數(shù)量有限,現(xiàn)有技術(shù)難以綜合利用設計、研制、試驗和在軌的多源數(shù)據(jù),故障預警準確率低。因此,有必要結(jié)合人工智能技術(shù),開展基于多源高維數(shù)據(jù)融合的故障預警技術(shù)研究。
2) 數(shù)據(jù)與知識相結(jié)合的故障預警技術(shù)
從人類發(fā)射第一顆航天器到今天,全球發(fā)射航天器的總數(shù)已超過上千顆,中國已超過300顆。在幾十年的發(fā)展歷程中,積累了大量航天器故障預警的經(jīng)驗和知識。但現(xiàn)有較為成熟的基于可靠性統(tǒng)計、失效物理模型以及數(shù)據(jù)驅(qū)動的技術(shù)方法,均難以將這些知識充分的融入到故障預警過程中。借助人工智能技術(shù),實現(xiàn)數(shù)據(jù)與知識的充分融合和利用,將會是未來航天器故障預警的一個重要發(fā)展方向。
1) 跨時空域度的故障診斷技術(shù)
現(xiàn)有的航天器故障診斷技術(shù)僅考慮在軌運行數(shù)據(jù),未充分利用其他航天器的在軌歷史數(shù)據(jù)以及產(chǎn)品的研制、測試數(shù)據(jù),造成大量有用信息的浪費。開展跨時空域度的故障診斷技術(shù)研究,能夠?qū)Σ煌瑲v史階段、不同型號以及不同階段發(fā)生的故障進行融合,提高故障信息的利用率,提升故障診斷的準確性和對環(huán)境的適應性。
2) 故障診斷模型的遷移與壓縮方法
為實現(xiàn)跨時空域度的故障診斷,需要開展故障診斷模型遷移方法的研究:在將其他航天器的在軌數(shù)據(jù)和歷史數(shù)據(jù)引入本航天器故障診斷時,需要考慮不同航天器之間的差異,實現(xiàn)“歷史”與“在軌”的遷移;在將產(chǎn)品的研制、測試數(shù)據(jù)引入故障診斷時,需要考慮天地異構(gòu)環(huán)境的差異,實現(xiàn)“地面”與“在軌”的遷移。同時,考慮到現(xiàn)有星載計算機的數(shù)據(jù)存儲和處理能力較為有限,難以支持智能故障診斷算法龐大的計算開銷,因此需要開展故障診斷模型壓縮方法的研究,實現(xiàn)地面復雜智能算法的在軌等效應用。
1) 考慮非線性演化規(guī)律和權(quán)重自適應調(diào)整的壽命評估技術(shù)
現(xiàn)有壽命評估技術(shù)在航天領(lǐng)域的應用范圍有限,主要原因在于:一方面,現(xiàn)有技術(shù)在建立壽命評估模型的過程中,主要考慮了數(shù)據(jù)的近似線性化表征,而忽略了非線性因素的影響;事實上,在航天器控制系統(tǒng)的退化特征中,存在極強的非線性。因此,為了進一步提升評估的準確性,需要研究航天器控制系統(tǒng)的非線性退化軌跡函數(shù),使其更符合實際系統(tǒng)的退化數(shù)據(jù)特性。另一方面,在多源數(shù)據(jù)融合模型中,其融合權(quán)重的分配至關(guān)重要,對于權(quán)重方法的選擇也要更加謹慎,融合權(quán)重的方法有主觀性的,有客觀性的,還有主觀客觀相結(jié)合的,選用不同權(quán)重分析方法,其融合先驗分布不同,壽命評估結(jié)果的精度也會有所偏差。因此,需要研究一種權(quán)重自適應確定方法來確定合適的融合權(quán)重。
2) 具有有效評價機制的壽命評估技術(shù)
由于底層部件的壽命是系統(tǒng)壽命的基礎,而底層部件的壽命又依賴于建模所用模型以及部件SHA的輸入。在對部件性能退化、參數(shù)退化、可靠性的建模過程中,模型誤差不可避免,使得壽命評估結(jié)果的準確性存在偏差。因此,需要研究系統(tǒng)壽命評估結(jié)果的評價機制,用于定性甚至定量分析壽命評估結(jié)果的準確性。
航天數(shù)字化將從基于模型的系統(tǒng)工程(MBSE)階段過渡到全生命周期基于數(shù)字孿生的設計、制造和運維,充分滿足天地平行管控、在軌快速響應等未來大規(guī)模航天器的在軌操控和健康管理等應用需求[97-101]。數(shù)字孿生,利用數(shù)字技術(shù)對物理實體對象的特征、行為、性能、以及運行場景等進行描述和建模[102],并基于實時數(shù)據(jù)同步逼近物理實體在真實環(huán)境中的屬性、行為、規(guī)則等,為實現(xiàn)物理空間與信息空間交互與共融提供了解決方案。
在航天器健康管理領(lǐng)域,數(shù)字孿生技術(shù)的應用需要依靠航天器全生命周期的數(shù)據(jù),不斷培植和完善孿生體模型,具體如圖2所示。
在航天器設計與研制階段,利用地面和在軌數(shù)據(jù)(含研制和測試數(shù)據(jù)、歷史運行數(shù)據(jù)等),通過在線的學習與訓練,實現(xiàn)航天器系統(tǒng)功能級數(shù)字孿生模型的建立與完善,并結(jié)合知識算法模型,基于“系統(tǒng)協(xié)同設計平臺”形成航天器系統(tǒng)功能級數(shù)字孿生體,在此基礎上加入故障模型庫、智能健康管理方法庫,通過故障注入和模型訓練等操作和過程,實現(xiàn)對在軌故障狀態(tài)的地面數(shù)字化模擬,驗證星上自主健康管理技術(shù)的完備性和有效性。
進入系統(tǒng)的集成測試階段后,需要建立與地面測試設備平行一致的數(shù)字孿生體,在功能級模型的基礎上集成測試孿生體模型,進一步融入對部件性能、計算機與部件之間的接口測試等過程的模擬能力,基于地面測試階段的航天器數(shù)字孿生體,能夠仿真生成測試過程可能觸發(fā)的各類故障數(shù)據(jù),基于“系統(tǒng)智能測試平臺”訓練提升地面測試過程的自主異常定位能力,從而實現(xiàn)對系統(tǒng)地面驗證的無人值守自主測試及異常定位。
在軌飛行階段通過實際在軌數(shù)據(jù)驅(qū)動地面數(shù)字孿生體進行模型完善與修正,從而對在軌航天器的實時狀態(tài)進行動態(tài)、真實、細致的反映?;谠谲壓教炱骷捌溥\行環(huán)境的地面數(shù)字孿生系統(tǒng),一方面可實時掌握在軌航天器的健康狀態(tài),用于進行故障預警、故障診斷、壽命評估等健康管理,將在軌維護從事后處理向事前維修轉(zhuǎn)換;另一方面根據(jù)數(shù)字孿生系統(tǒng)對在軌狀態(tài)的動態(tài)模擬,對星上智能自治算法進行再訓練,具備更新能力的診斷方法驗證成熟后可同步上注到在軌航天器,實現(xiàn)天地系統(tǒng)與模型之間基于在軌數(shù)據(jù)的協(xié)同進化,技術(shù)途徑如圖3所示。
圖3 基于在線學習的天地協(xié)同進化示意圖Fig.3 Diagram of co-evolution of Heaven and Earth based on online learning
本文在已有的航天器智能自主控制系統(tǒng)新架構(gòu)基礎上,梳理了現(xiàn)有航天器健康管理技術(shù)在實際工程應用中所面臨的挑戰(zhàn),從故障預警、故障診斷和壽命評估3個方面歸納、總結(jié)了該技術(shù)領(lǐng)域現(xiàn)有理論研究與應用的具體情況,并提出了未來可能的技術(shù)發(fā)展方向。
通過對航天器控制系統(tǒng)智能健康管理技術(shù)發(fā)展情況的詳細調(diào)研,可以發(fā)現(xiàn):健康管理作為航天器智能自主控制系統(tǒng)的重要支撐,為航天器在軌自主運行提供了穩(wěn)定可靠的自檢、自治、自救能力,是未來實現(xiàn)大規(guī)模星群自適應、自組織、智能化發(fā)展的重要保障;同時,隨著大數(shù)據(jù)時代和人工智能技術(shù)的迅速發(fā)展為航天產(chǎn)業(yè)賦能,發(fā)展航天器控制系統(tǒng)的智能健康管理技術(shù)既是航天產(chǎn)業(yè)發(fā)展的必然階段,更是航天強國建設的時代需求,將人工智能技術(shù)與健康管理技術(shù)融合,必將成為航天器從自動化向智能化發(fā)展的新起點。