馬小博,王 芳2,陳 益,李亞鋒
(1.西安航空計算技術研究所,西安 710068;2.空裝駐西安地區(qū)軍事代表局第六代表室,西安 710068)
隨著信息技術的不斷發(fā)展,飛機機載設備的復雜度、綜合化、智能化程度急劇增加,雖然綜合化帶來設備的數(shù)量在減少,但是單個設備的成本確處于上升趨勢,傳統(tǒng)的設備維修性、保障性等逐漸難以適應復雜的設備維修需要,故障定位慢、維修時間長、備件成本高等問題會帶來生命周期成本的提高。為了滿足信息化條件下作戰(zhàn)飛機效能,針對復雜電子設備的故障診斷技術的研究也在不斷的深入開展,希望能夠找到一種快速定位故障,快速維修的方法,降低復雜電子設備帶來的維修與保障成本。20世紀90年代國外提出了一種PHM(Prognostics and Health Management)技術,也就是預測與健康管理技術,并得到了各軍事強國的高度重視,PHM已被認為是提高系統(tǒng)“五性”和降低全壽命周期費用的關鍵技術。對于飛機用戶方,不斷降低航空飛行器生命周期費用的需求非常強烈,需要不斷縮短設備的維修時間。通常提高機載電子設備的維護性需要增加平均無故障時間或減少平均修復時間。增加平均無故障時間要求增加系統(tǒng)的可靠性,提高和優(yōu)化設備的使用環(huán)境,通常會帶來機載設備成本的大幅度提升,另外一種方式是在盡量不增加成本費用的情況下,需要通過提前預警的方式,降低平均修復時間,也可以達到提升設備維護性的目的。目前傳統(tǒng)的方法是采用修復性維修和定期維修,這種維修可能導致系統(tǒng)失效后維修時間長或者過修。很難對維修時間有較高的提升。在降低平均修復時間因此需要采取新的方法提前診斷和預測故障,通過提前介入維修降低維修時間,提高飛行器任務執(zhí)行的及時率。
本文通過設計新的電子設備故障監(jiān)視預警電路、建立一套故障預測推理模型提前預警即將發(fā)生的故障,可實現(xiàn)提前故障預警,使得維護人員可提前介入維修和提供備件,縮短準備時間,通過建立故障預警后的故障定位輔助決策算法,實現(xiàn)對系統(tǒng)工作過程中故障的監(jiān)測、定位,也能夠有效的縮短設備故障后的維修時間,有效提高了系統(tǒng)的可維護性,降低了系統(tǒng)平均修復時間。
隨著機載計算機復雜度的不斷提升,目前的事后維修和定期維修對于飛機的實時完好性有一定的影響,其故障維修時間在不斷的延長,“視情維修”變得更為迫切,視情維修的重點是對機載計算機系統(tǒng)故障機理和故障模式要有充分的認識和研究,有較為大量的故障數(shù)據(jù)分析結果,對計算機的運行情況、軟硬件狀態(tài)能夠實時的進行“體檢”,區(qū)別于傳統(tǒng)的機內自測試BIT(Buid-in Test),是一種涵蓋了狀態(tài)故障預測與機內BIT的復雜健康管理技術的應用體現(xiàn)。
目前飛行器的故障預測與健康管理(PHM)的相關技術研究與應用研究發(fā)展迅速,先進飛機系統(tǒng)已經(jīng)建立了專門的綜合飛行器健康管理(IVHM)系統(tǒng),負責整個飛機的健康監(jiān)控與故障預測。IVHM將機載健康管理劃分為飛機級故障預測與健康管理(APHM)、子系統(tǒng)級故障預測與健康管理(SPHM)、以及模塊(設備)級故障預測與健康管理(MPHM),MPHM是飛機IVHM的基礎,比如計算機設備需要提供諸多設備信息的健康狀態(tài)、故障信息、周邊環(huán)境信息。由于計算機的復雜性和專用性,這方面的研究相對較少,工程應用也處于數(shù)據(jù)的積累階段。機載計算機通常由大規(guī)模集成電路器件、分立器件、定制功能組件、專用軟件組成,健康監(jiān)控的重點是對這些組件及元器件的運行狀態(tài)及周邊環(huán)境的監(jiān)控測量,實時的發(fā)現(xiàn)異常情況。
綜上所述機載計算機的健康管理是在飛機健康管理體系下的基礎級健康管理,對飛機級的故障預測與健康管理提供有效的狀態(tài)監(jiān)控信息,為整個飛機的維護性和安全性提供支持。而機載計算機自身的故障診斷,也可以基于新的健康管理技術,結合已有的BIT技術,設計針對性的故障預測預警功能,提供設備級的維護與保障支持。從機載計算機的特征切入,開展故障敏感數(shù)據(jù)信息采集,挖掘信息進行預警預測,建立預測模型推斷可能的故障,并根據(jù)預測信息進行輔助決策故障定位。
機載計算機等電子產(chǎn)品主要由大規(guī)模集成電路和分立器件組成,其功能失效主要是由于器件經(jīng)過長時間的外部應力作用出現(xiàn)器件老化或性能退化引起,有分析和實驗結果表明外部應力的惡劣會縮短電子器件的壽命。針對這種潛在的緩慢變化引起的器件失效,分析器件的故障模式,對器件相關功能區(qū)域威脅較大的應力進行監(jiān)控和監(jiān)測,選取典型的失效模式監(jiān)控方法,如時序監(jiān)控、功耗測量、溫度應力測量、振動應力測量等,捕獲典型引起故障的應力數(shù)據(jù)。為此也需要在功能電路內部嵌入傳感器或增加測量電路,建立專門的預測預警功能電路。預測預警電路能夠準確的反應計算機的環(huán)境應力情形,計算機各功能的運行狀態(tài),提供實時的變化趨勢信息等。
機載計算機故障預測技術采用基于功能區(qū)域的威脅分析。首先對實現(xiàn)系統(tǒng)功能的組件塊進行威脅分析,提取不同應力環(huán)境對組件塊的影響,對不同的組件塊設置不同的監(jiān)視傳感器和預警電路,研究典型性能下降的特征參數(shù)、提取故障特征,評估故障狀態(tài),監(jiān)視系統(tǒng)運行環(huán)境,預測系統(tǒng)健康狀況。機載計算機故障預測技術的基本原理如圖1所示。機載計算機相關功能區(qū)域威脅主要包括:熱威脅功能區(qū)域;振動威脅功能區(qū)域;電應力威脅功能區(qū)域;時序偏移威脅功能區(qū)域;電壓漂移威脅功能區(qū)域。機載計算機相關故障征兆分析主要包括:輸出電壓低漂移;時序漂移或工作不穩(wěn)定;數(shù)據(jù)不穩(wěn)定;過熱或工作不穩(wěn)定;時序抖動;接口時斷時續(xù),接口數(shù)據(jù)抖動。機載計算機相關監(jiān)測參數(shù)選擇主要包括:輸出工作電壓;時序抖動檢測;工作溫度;振動環(huán)境;內部回繞狀態(tài)。
圖1 機載計算機故障預測技術
熱威脅區(qū)域敏感區(qū)主要集中在機載計算機散熱量較大的集成電路區(qū)域,包括像中央處理器CPU芯片,大容量FPGA芯片,高速存儲芯片、網(wǎng)絡、顯示等芯片組成的功能區(qū)間內,通過對該區(qū)域進行熱威脅相關狀態(tài)監(jiān)控,監(jiān)測機載計算機熱功能威脅區(qū)域的熱應力變化趨勢,對異常熱應力進行提前預判。故障預測預警電路在熱威脅區(qū)域設計專門的溫度傳感器,并且該溫度傳感器滿足機載熱應力的溫度范圍,電路如圖2, 該溫度傳感器每增加1 ℃,其電流增加1 μA,在0 ℃時,電流值為273.15 μA,故此可計算得知在機載環(huán)境溫度-55~+125 ℃,電流值為218.15~398.15 μA,其串接電阻1 K,則A/D可采集的電壓范圍為Gx(218.15~398.15 mV),即4.123~7.525 V。機載計算機預測預警軟件結合熱應力預警電路可實時監(jiān)控熱威脅區(qū)域的溫度變化情況,并能夠對異常發(fā)出告警信息。
圖2 熱應力預警電路
振動威脅區(qū)域敏感區(qū)主要集中在體積重量較大的器件,比如較大的儲能電容、較大的定制組件、安裝結構件加固的重要部位等功能區(qū)間內,通過檢測機載計算機振動功能威脅區(qū)域的振動量級,對出現(xiàn)異常振動兩級進行故障預判,振動傳感器處理電路如圖3,振動傳感器輸出為線性電壓,其敏感度為50 mV/g,在0 g時輸出電壓為2.5 V,為了更直觀顯示其加速度與電壓之間的關系,在后級和差電路中減去2.5 V的0 g電壓,X軸與Y軸設計一致,后級比例因子可由下式給出。
G=R115/R545=196K/51K=3.84
則A/D采集的電壓與加速度通過下式給出。例:若振動量級為10 g,則轉換后電壓值。
V = 0.05×3.84× g
V = 0.05×3.84×10 =1.92 V
機載計算機預測預警軟件結合振動應力預警電路可實時監(jiān)控振動威脅區(qū)域的振動量級變化情況,并能夠對異常發(fā)出告警信息。
圖3 振動傳感器處理電路
由于復雜的機載計算機聯(lián)結眾多的外部設備,每一種外部設備的對外接口形式多樣,也有許多非智能設備與計算機交聯(lián),因此電應力威脅區(qū)域主要在機載計算機接口部分,采用在線監(jiān)控的方式對接口電路進行故障預測與診斷,對輸入信號采用比較監(jiān)控的方式進行診斷,對輸出信號采用回繞監(jiān)控的方式進行診斷。離散量輸出電路原理如圖4所示,圖中控制電路的作用是輸出鎖存信號,最后經(jīng)達林頓管改變電平并增加輸出驅動能力,輸出給外部設備或系統(tǒng)。另外根據(jù)故障診斷的要求,輸出信號設計兩級級回繞測試電路。機載計算機預測預警軟件結合電應力的預警電路可實時監(jiān)控電應力威脅區(qū)域的各類型測試結果,并能夠對異常發(fā)出告警信息。
圖4 輸入信號監(jiān)控示意
圖5 輸出信號監(jiān)控示意
時序對于數(shù)字計算機的準確運行異常重要,但計算機的時序通常是一個容易被忽略的特征區(qū),是因為對于時序監(jiān)控通常難度較大,因此需要設計專門定制的時序特征故障監(jiān)控電路監(jiān)控時序的故障,為了檢測典型時序信號的漂移,設計時鐘互比監(jiān)控傳感器設計如圖6所示。其中33 M時鐘用于計算機自己的調試,66 M時鐘用于多個處理器之間的訪問,100 M時鐘用于CPU訪問存儲等資源。以兩個CPU(CPUA,CPUB)訪問為例,根據(jù)不同時鐘的影響范圍,時鐘檢測傳感器判斷結果處理見表1。機載計算機預測預警軟件結合時序監(jiān)控預警電路可實時監(jiān)控時序特征區(qū)域的測試結果,并能夠對異常發(fā)出告警信息,并按照已擬定的結果進行相關處理。
圖6 時序時鐘互比監(jiān)控示意
功耗特征區(qū)域主要集中在為機載計算機產(chǎn)生二次供電的區(qū)域,通常機載計算機都會有專門的供電轉換模塊,為計算機的處理器、存儲、接口、網(wǎng)絡等所有器件提供所需的供電,因此各供電的功耗變化會引起供電電壓的抖動,這是重要的故障關注點,針對功耗特征功能區(qū)域對健康的影響,設置二次電源監(jiān)控器,通常包括5 V、+15 V、-15 V等多種電源監(jiān)控處理電路,分別產(chǎn)生電源有效信號作為電源故障指示源之一,最后通過或門電路進行綜合輸出總的二次電源指示電源的正常與否。電源監(jiān)控主要工作原理包括:
當某一電源低于預警值時,比較器發(fā)生狀態(tài)反轉,輸出為“低”;并通過與門電路綜合出總的電源指示信號為“低”,表征某一電源從有效變?yōu)楣收希?/p>
當電源高于預警值,比較器發(fā)生狀態(tài),輸出為“高”, 并通過與門電路綜合出總的電源指示信號為“高”,表征某一電源從故障變?yōu)橛行А?/p>
表1 時鐘檢測傳感器判斷結果處理
根據(jù)機載計算機的工作條件,電應力特征區(qū)預警、時序特征區(qū)預警,有相應的真實監(jiān)控電路,準確率高,可直接進行故障處置。但對于環(huán)境應力如振動、熱的監(jiān)控有異常不足以說明計算機故障情況,需要在已有數(shù)據(jù)信息的基礎上建立環(huán)境應力和功耗特征區(qū)故障推理模型。健康預測選取的特征包括3種,分別是:
1)熱威脅對健康的影響,設置2級監(jiān)視門限,分別是:
大于80 ℃小于100 ℃:惡劣環(huán)境威脅;
大于100 ℃:強惡劣環(huán)境威脅。
2)振動威脅對健康的影響,設置1級監(jiān)視門限:大于26 g為一般惡劣環(huán)境威脅;
3)功耗特征功能區(qū)域對健康的影響,設置二次電源采集,跟蹤信號特征的長期變化,設置監(jiān)視門限包括:
5 V電源低于4.5 V持續(xù)時間大于10 ms:一般壽命威脅;
+15 V電源低于+13 V持續(xù)時間大于10 ms:一般壽命威脅;
-15 V電源高于-13 V持續(xù)時間大于10 ms:一般壽命威脅。
圖7 初步預測推理模型
根據(jù)區(qū)域威脅分析,處理器單元、存儲單元、接口控制單元、電源轉換單元易受熱威脅區(qū)域,通過溫度監(jiān)控可提取各功能區(qū)域的溫度,通過預測模型可提前進行熱威脅告警,但對于故障的監(jiān)控定位,故障預測并不能像時序、回繞監(jiān)控進行精確定位,因此需要建立輔助決策系統(tǒng)進行熱威脅區(qū)域的定位。同樣功耗威脅也需要輔助決策系統(tǒng)對功耗區(qū)域進行故障定位,故障定位輔助決策通常針對單事件故障定位和關聯(lián)事件故障定位,通過對故障征兆數(shù)據(jù)采集,故障模擬數(shù)據(jù)采集,因果關系推理,建立故障輔助決策系統(tǒng),輔助決策系統(tǒng)建立流程見圖14。
圖8 輔助決策建立流程
基于健康管理的智能故障診斷方法在某預先研究課題中已完成了相關技術攻關,并原理樣機中進行了包括熱、功耗、電、振動、時序的故障注入驗證,能夠有效的對環(huán)境應力變化發(fā)出預警和定位。在某型機載計算機的研制過程中,也已采用該方法并通過擴展FMEA開展分析計算,該方法對有源器件故障預測覆蓋率69.2%,有源器件失效率故障預測覆蓋率78.9%,其預測推理模型的有效性和準確性在后續(xù)試驗及使用中將進一步跟蹤驗證。
本文通過分析機載計算機環(huán)境應力及內部功能面臨的不同威脅,建立了有針對性的功能區(qū)域的威脅故障預測與監(jiān)控電路,對計算機進行實時健康狀態(tài)監(jiān)控,設計了故障推理模型,可智能的對計算機故障進行診斷和預測,已將故障預測技術應用于機載計算機健康管理設計中,隨著該方法的不斷完善和成熟可以為機載計算機健康管理提供預警電路和預測模型,為飛機裝備的維護性安全性提供更完好的解決方案。