王亮 吳雄洲 吳云 中航工業(yè)西安航空計(jì)算技術(shù)研究所
故障處理是機(jī)載計(jì)算機(jī)系統(tǒng)的重要組成部分,隨著機(jī)載計(jì)算機(jī)使用的增多,輸入輸出信號(hào)種類(lèi)的增加,計(jì)算機(jī)內(nèi)部結(jié)構(gòu)越發(fā)復(fù)雜,對(duì)故障處理也提出了更高的要求。上一代機(jī)載計(jì)算機(jī)結(jié)構(gòu)簡(jiǎn)單,相對(duì)故障處理分散,內(nèi)部基本無(wú)專(zhuān)門(mén)的故障處理程序。此種故障處理機(jī)制處理能力低,可維護(hù)性差,不利于提高機(jī)載計(jì)算機(jī)性能發(fā)揮。
為了提高機(jī)載計(jì)算機(jī)系統(tǒng)故障處理能力,本文提出一種以故障登記表為基礎(chǔ)的,分類(lèi)、分級(jí)故障處理機(jī)制,將系統(tǒng)中的故障按照故障等級(jí)統(tǒng)一記錄在故障登記表中,進(jìn)行集中管理。
本文以雙余度機(jī)載計(jì)算機(jī)為平臺(tái),詳細(xì)闡述一種故障處理的方法。該雙余度計(jì)算機(jī)由以下模塊組成:中央處理模塊(CPM)、總線接口模塊(BIM)、電源模塊(PSM)。其中BIM模塊采集模擬量、離散量等數(shù)據(jù),同時(shí)對(duì)其進(jìn)行故障檢測(cè),CPM模塊接收并處理來(lái)自BIM模塊的數(shù)據(jù)及故障信息,將故障記錄在NVRAM中,BIM模塊與CPM通過(guò)ARINC659總線實(shí)現(xiàn)數(shù)據(jù)互傳。雙余度機(jī)載計(jì)算機(jī)組成結(jié)構(gòu)如圖1所示。
圖1 雙余度機(jī)載計(jì)算機(jī)組成結(jié)構(gòu)圖
雙余度機(jī)載計(jì)算機(jī)系統(tǒng)軟件由驅(qū)動(dòng)程序、互比監(jiān)控模塊軟件、余度管理軟件、故障處理軟件以及系統(tǒng)測(cè)試軟件構(gòu)成,如圖2所示。
(1)互比監(jiān)控軟件,接收來(lái)自驅(qū)動(dòng)程序的雙通道數(shù)據(jù),根據(jù)故障表中的互比參數(shù),對(duì)數(shù)據(jù)進(jìn)行互比監(jiān)控,并將互比故障信息上報(bào)給故障處理模塊,輸入數(shù)據(jù)上報(bào)給余度管理模塊。
(2)系統(tǒng)測(cè)試軟件,對(duì)整個(gè)計(jì)算機(jī)系統(tǒng)的所有硬件設(shè)備進(jìn)行上電自測(cè)試和周期自測(cè)試并將測(cè)試故障信息報(bào)給故障處理軟件。
(3)余度管理軟件,獲取來(lái)自故障處理軟件的故障等級(jí)表信息,根據(jù)故障等級(jí)表中的信息,對(duì)計(jì)算機(jī)內(nèi)部雙余度資源進(jìn)行管理。
(4)故障處理軟件,接收來(lái)自互比監(jiān)控軟件和系統(tǒng)測(cè)試軟件的故障信息,并將故障信息登記在故障表中,同時(shí)將故障信息以故障碼的形式發(fā)送給應(yīng)用程序,由應(yīng)用程序?qū)⒐收洗a發(fā)送給地面檢測(cè)設(shè)備。本文著重介紹故障處理軟件的設(shè)計(jì)。
圖2 系統(tǒng)軟件架構(gòu)圖
雙余度計(jì)算機(jī)故障處理算法以故障登記表為核心,獲取計(jì)算機(jī)故障統(tǒng)一管理,算法分為:故障檢測(cè)、故障記錄、故障申報(bào)、故障隔離與恢復(fù)。
故障處理軟件建立了故障登記表,將計(jì)算機(jī)故障信息記錄在故障表中,實(shí)現(xiàn)了系統(tǒng)故障的統(tǒng)一管理,通過(guò)查找故障登記表,系統(tǒng)就可以獲取當(dāng)前計(jì)算機(jī)的所有故障狀態(tài),極大的方便了后期系統(tǒng)排故維護(hù)。與故障分類(lèi)對(duì)應(yīng),將故障表分為兩種類(lèi)型:故障總表和故障子表。其中故障總表用于記錄與遍歷故障子表,故障子表用于記錄不同類(lèi)型的故障,故障子表中包含:故障編碼,故障計(jì)數(shù),故障現(xiàn)場(chǎng),故障互比類(lèi)型與互比門(mén)限。
當(dāng)故障發(fā)生時(shí),故障處理軟件遍歷故障總表與故障子表,定位該故障在故障表中的位置,將其對(duì)應(yīng)的故障計(jì)數(shù)加1。若故障計(jì)數(shù)大于或等于故障門(mén)限,則記錄故障狀態(tài)為永久故障(否則為瞬時(shí)故障),并將該故障狀態(tài)上報(bào)給余度管理軟件,由余度管理軟件,對(duì)系統(tǒng)資源進(jìn)行重新分配,同時(shí)將故障編碼上報(bào)給應(yīng)用程序,由應(yīng)用軟件完成故障的對(duì)外申報(bào)。故障記錄算法流程如圖3所示。
圖3 故障記錄算法
故障處理模塊遍歷故障總表與故障子表,若發(fā)生瞬時(shí)故障,則置當(dāng)前數(shù)據(jù)狀態(tài)為失效,由余度管理軟件向應(yīng)用程序上報(bào)歷史數(shù)據(jù),若該故障恢復(fù)正常,故障計(jì)數(shù)減為零,則清除當(dāng)前故障,由余度管理軟件向應(yīng)用程序上報(bào)當(dāng)前數(shù)據(jù),實(shí)現(xiàn)瞬時(shí)故障數(shù)據(jù)恢復(fù)的功能。
若信號(hào)數(shù)據(jù)故障狀態(tài)達(dá)到永久故障,判斷該故障的故障等級(jí),若為I級(jí)或II級(jí)故障,則切除故障模塊,若為III級(jí)故障,則按照信號(hào)名稱(chēng),切除該信號(hào)對(duì)應(yīng)功能模塊,將故障影響域限制在最小范圍內(nèi),實(shí)現(xiàn)永久故障隔離。
本文提出的以故障登記表為基礎(chǔ),對(duì)故障進(jìn)行分類(lèi)分等級(jí)管理,能夠更好的將影響飛機(jī)安全的故障隔離,適時(shí)恢復(fù)影響部分功能的故障,提高系統(tǒng)可用性。所有故障信息均登記在同一個(gè)故障表中,便于用戶的管理。所有故障信息均有唯一的故障編碼,便于用戶外場(chǎng)定位和排查故障。