趙 剛 ,任永勝 ,劉 瑞 ,孫 戰(zhàn) ,孔秀文
(1.北方自動(dòng)控制技術(shù)研究所,太原 030006;2.北京陸軍軍事代表局,北京 100012)
火控系統(tǒng)BIT設(shè)計(jì)與實(shí)現(xiàn)
趙 剛1,任永勝2,劉 瑞1,孫 戰(zhàn)1,孔秀文1
(1.北方自動(dòng)控制技術(shù)研究所,太原 030006;2.北京陸軍軍事代表局,北京 100012)
采用層級(jí)BIT設(shè)計(jì)架構(gòu),建立了系統(tǒng)級(jí)和模塊級(jí)BIT系統(tǒng)設(shè)計(jì)模型。設(shè)計(jì)了PBIT、CBIT、IBIT測(cè)試項(xiàng)探測(cè)函數(shù)、恢復(fù)函數(shù)等節(jié)點(diǎn)屬性的統(tǒng)一數(shù)據(jù)結(jié)構(gòu)。引入故障樹(shù)理論設(shè)計(jì)了PBIT、CBIT、IBIT通用自動(dòng)遍歷故障樹(shù)測(cè)試算法,可以實(shí)現(xiàn)多種火控系統(tǒng)的“自下而上”的節(jié)點(diǎn)測(cè)試和“自上而下”的故障診斷。在某火控系統(tǒng)預(yù)研項(xiàng)目的應(yīng)用表明,本BIT系統(tǒng)的設(shè)計(jì)方案合理可行,易于維護(hù),可顯著提高通用火控系統(tǒng)的測(cè)試性和可靠性。
BIT,故障樹(shù),火控系統(tǒng)測(cè)試
按照美軍標(biāo)MIL-STD-1309C定義,機(jī)內(nèi)測(cè)試技術(shù)(BIT,Build In Test)是指“系統(tǒng)、設(shè)備內(nèi)部提供的檢測(cè)、隔離故障的自動(dòng)測(cè)試能力”,也即借助于系統(tǒng)、設(shè)備內(nèi)部的故障檢測(cè)、故障隔離、故障診斷能力建立的自動(dòng)測(cè)試能力[1]。BIT技術(shù)的實(shí)現(xiàn)不依賴(lài)于外部設(shè)備,僅依賴(lài)于自身內(nèi)部的硬件或軟件實(shí)現(xiàn)測(cè)試,由系統(tǒng)、設(shè)備內(nèi)部自身給出激勵(lì)信號(hào)、接收相應(yīng)信號(hào),通過(guò)系統(tǒng)判據(jù)進(jìn)行測(cè)試結(jié)果的判斷,從而實(shí)現(xiàn)系統(tǒng)、設(shè)備的測(cè)試功能。研究表明BIT技術(shù)可以有效提高系統(tǒng)診斷能力、降低維修時(shí)間[1-3]。
目前,武器裝備更加注重通用質(zhì)量特性的提高,新一代武器平臺(tái)火控系統(tǒng)都具有比較完善的機(jī)內(nèi)測(cè)試系統(tǒng)[4-5],機(jī)內(nèi)測(cè)試系統(tǒng)可以對(duì)火控系統(tǒng)進(jìn)行實(shí)時(shí)監(jiān)測(cè)、發(fā)現(xiàn)故障,并將故障隔離至LRU級(jí),甚至SRU級(jí),快速指導(dǎo)維修人員進(jìn)行維修更換。完善的機(jī)內(nèi)測(cè)試系統(tǒng)顯著提高了火控系統(tǒng)的測(cè)試性、維修性和保障性,以致很多故障可以在一線檢測(cè)、現(xiàn)場(chǎng)維修,可以有效提高武器裝備的通用質(zhì)量特性。此外,機(jī)內(nèi)測(cè)試系統(tǒng)可以顯著簡(jiǎn)化測(cè)試維修設(shè)備,可以降低火控系統(tǒng)全壽命周期費(fèi)用。
基型火控系統(tǒng)是具有體系架構(gòu)開(kāi)放、技術(shù)標(biāo)準(zhǔn)統(tǒng)一,能跨平臺(tái)應(yīng)用,具有靈活性、組合性和重構(gòu)性的火控系統(tǒng)通用軟硬件平臺(tái)。綜合模塊化火控系統(tǒng)定義了信息處理、交互顯示、指揮通信、信息傳感、武器控制、接口互聯(lián)不同的功能分區(qū),其中信息處理、交互顯示和接口互聯(lián)功能分區(qū)為跨平臺(tái)共用的最大集合,構(gòu)成了基型火控系統(tǒng)。基型火控系統(tǒng)采用現(xiàn)場(chǎng)可更換模塊(LRM)設(shè)計(jì),由多個(gè)功能模塊組成,根據(jù)基型火控系統(tǒng)組成來(lái)看,該系統(tǒng)屬于典型的分布式系統(tǒng)架構(gòu)。
基型火控系統(tǒng)BIT系統(tǒng)遵循下列設(shè)計(jì)原則:
(1)BIT設(shè)計(jì)從方案論證開(kāi)始,與系統(tǒng)設(shè)計(jì)同步開(kāi)展;
(2)BIT設(shè)計(jì)應(yīng)盡量不影響火控系統(tǒng)的正常工作;
(3)考慮故障檢測(cè)率和隔離率的要求;
(4)應(yīng)同時(shí)考慮軟件監(jiān)測(cè)和硬件檢測(cè)方法;
(5)BIT設(shè)計(jì)應(yīng)具有通用性;
(6)BIT設(shè)計(jì)應(yīng)盡量復(fù)用系統(tǒng)硬件;
(7)應(yīng)預(yù)留自動(dòng)測(cè)試設(shè)備(ATE)的外部接口;
基于BIT開(kāi)展測(cè)試性設(shè)計(jì)的原理如下:
(1)明確火控系統(tǒng)測(cè)試性設(shè)計(jì)要求。包括火控系統(tǒng)定量要求和定性要求,定量要求包括火控系統(tǒng)故障覆蓋率、故障檢測(cè)率、故障隔離率。
(2)根據(jù)火控系統(tǒng)的系統(tǒng)特性,采用自頂向下的原則,確定火控系統(tǒng)的層次結(jié)構(gòu),將火控系統(tǒng)合理劃分為火控系統(tǒng)子功能模塊和單元。
(3)開(kāi)展火控系統(tǒng)的故障模式影響分析(簡(jiǎn)稱(chēng)為FMEA)和故障模式影響及危害度分析(簡(jiǎn)稱(chēng)為FMECA)。
(4)在FMEA和FMECA分析的基礎(chǔ)上確定BIT設(shè)計(jì)方法。包括BIT功能要求、測(cè)試項(xiàng)的選取、測(cè)試總線的選取、測(cè)試性設(shè)計(jì)方法的選取以及運(yùn)用軟件輔助設(shè)計(jì)等。
(5)進(jìn)行測(cè)試性分析。驗(yàn)證BIT設(shè)計(jì)是否滿(mǎn)足測(cè)試性指標(biāo)要求。
根據(jù)部隊(duì)最新的兩級(jí)武器裝備保障需求,將基型火控系統(tǒng)劃分至不同的保障層級(jí),包括基層級(jí)和基地級(jí)。其中基層級(jí)以現(xiàn)場(chǎng)可更換單元(LRU)的直接更換為主,基地級(jí)以車(chē)間可更換單元(SRU)(含芯片級(jí))的更換與維修為主?;突鹂叵到y(tǒng)通用處理單元的功能原理圖如圖1所示,屬于SOC系統(tǒng),包括CPU、控制橋片、RAM、ROM、ES以及外圍輔助電路和接口。
表1 綜合處理單元層次結(jié)構(gòu)
基于上述BIT設(shè)計(jì)原則、設(shè)計(jì)思路和基型火控系統(tǒng)的系統(tǒng)架構(gòu),確定了BIT系統(tǒng)采用基于以太網(wǎng)總線的多機(jī)分布式系統(tǒng)架構(gòu)。按照盡可能復(fù)用系統(tǒng)硬件資源的原則,BIT與系統(tǒng)共用網(wǎng)絡(luò)總線。BIT系統(tǒng)采用層級(jí)系統(tǒng)架構(gòu)設(shè)計(jì),由火控系統(tǒng)級(jí)BIT服務(wù)(HK_BIT)、模塊級(jí)的 BIT服務(wù)(RE_BIT)和單元級(jí)BIT服務(wù)(UN_BIT)組成。RE級(jí)的BIT維護(hù)負(fù)責(zé)監(jiān)測(cè)單個(gè)模塊的健康狀況,采集各單元級(jí)BIT服務(wù)的監(jiān)測(cè)狀態(tài),對(duì)模塊自身的健康進(jìn)行分析和處理,同時(shí)將采集到的原始信息和處理后的信息發(fā)送給HK級(jí)的BIT服務(wù),火控系統(tǒng)級(jí)的BIT服務(wù)對(duì)所有模塊的健康狀況匯總后,進(jìn)行統(tǒng)一處理,并在嚴(yán)重故障發(fā)生時(shí),根據(jù)通用系統(tǒng)管理決策調(diào)度所有模塊進(jìn)行重構(gòu)。其系統(tǒng)組成如圖2所示。
HK_BIT實(shí)現(xiàn)模塊級(jí)狀態(tài)監(jiān)測(cè)、模塊級(jí)故障處理和BIT檢測(cè)命令的分發(fā)。HK_BIT駐留于主控制模塊通過(guò)應(yīng)答信息監(jiān)測(cè)模塊級(jí)狀態(tài),同時(shí)接收模塊級(jí)BIT服務(wù)上報(bào)的故障信息,并進(jìn)行故障過(guò)濾、故障恢復(fù)、故障記錄、故障隔離、故障顯示和故障處理等功能。
RE_BIT負(fù)責(zé)各自模塊內(nèi)部UN_BIT的檢測(cè)的觸發(fā),及模塊內(nèi)檢測(cè)結(jié)果的過(guò)濾、故障恢復(fù)、故障記錄、故障隔離等功能。
UN_BIT負(fù)責(zé)單元級(jí)的檢測(cè)及檢測(cè)結(jié)果的初步處理。UN_BIT檢測(cè)項(xiàng)覆蓋模塊內(nèi)主要單元級(jí)組件或芯片。
故障樹(shù)分析法(FTA)是分析系統(tǒng)可靠性和安全性的一種系統(tǒng)性分析方法。可以用來(lái)分析系統(tǒng)故障產(chǎn)生的原因,計(jì)算系統(tǒng)各個(gè)組成單元的可靠度以及對(duì)整個(gè)系統(tǒng)的影響。以此找出系統(tǒng)的薄弱環(huán)節(jié),并在設(shè)計(jì)中采取設(shè)計(jì)改進(jìn)措施,實(shí)現(xiàn)優(yōu)化設(shè)計(jì)。本文采用演繹法建立通用火控系統(tǒng)的故障樹(shù)模型,并建立了RE級(jí)、UN級(jí)的邏輯關(guān)系以及層次結(jié)構(gòu),如圖3所示。
(1)BIT探測(cè)項(xiàng)及探測(cè)方法
BIT探測(cè)的目的是為獲取被測(cè)模塊、單元的狀態(tài)。如前文所示,模塊級(jí)的狀態(tài)通過(guò)應(yīng)答信息監(jiān)測(cè)模塊級(jí)狀態(tài),方法較為成熟,這里不再詳細(xì)描述。本章節(jié)主要描述單元級(jí)測(cè)試項(xiàng)及其測(cè)試方法。基型火控系統(tǒng)的通用處理單元通常包括CPU、控制橋片、RAM、ROM、ES以及外圍輔助電路和接口。通過(guò)前文所述的綜合處理單元層次結(jié)構(gòu)梳理出的芯片,結(jié)合火控系統(tǒng)測(cè)試性指標(biāo)要求,列出基型火控系統(tǒng)各個(gè)LRM模塊中的中的單元級(jí)BIT可測(cè)試項(xiàng)目,測(cè)試項(xiàng)包括CPU、RAM、ROM、網(wǎng)卡、接口等,部分測(cè)試項(xiàng)如表2所示。
(2)BIT檢測(cè)流程
BIT檢測(cè)時(shí),系統(tǒng)啟動(dòng)進(jìn)行BIT檢測(cè),根據(jù)預(yù)設(shè)的故障樹(shù)“至下而上”進(jìn)行故障樹(shù)的遍歷。如下頁(yè)圖4所示,過(guò)程如下:調(diào)取故障樹(shù)的BIT節(jié)點(diǎn)探測(cè)函數(shù)及恢復(fù)函數(shù),執(zhí)行探測(cè)函數(shù),記錄探測(cè)結(jié)果;發(fā)現(xiàn)故障時(shí),執(zhí)行該BIT探測(cè)節(jié)點(diǎn)的恢復(fù)函數(shù),故障恢復(fù)成功,則遍歷下一BIT探測(cè)節(jié)點(diǎn);故障不能恢復(fù)時(shí),上溯故障樹(shù)的上一級(jí)節(jié)點(diǎn),調(diào)取上一節(jié)點(diǎn)的恢復(fù)函數(shù)進(jìn)行故障恢復(fù),并進(jìn)行故障的存儲(chǔ)、顯示;直到上溯到故障樹(shù)的最上層節(jié)點(diǎn)進(jìn)行故障恢復(fù)。
表2 探測(cè)函數(shù)及探測(cè)方法
(3)BIT診斷流程
故障診斷時(shí),系統(tǒng)啟動(dòng)進(jìn)行BIT檢測(cè),根據(jù)預(yù)設(shè)的故障樹(shù)“至上而下”進(jìn)行故障樹(shù)的遍歷。如圖5所示,過(guò)程如下:根據(jù)故障現(xiàn)象調(diào)取故障樹(shù)的BIT節(jié)點(diǎn)探測(cè)函數(shù),執(zhí)行探測(cè)函數(shù),記錄探測(cè)結(jié)果;發(fā)現(xiàn)故障時(shí),調(diào)用該基本事件下級(jí)節(jié)點(diǎn)執(zhí)行該節(jié)點(diǎn)的探測(cè)函數(shù),進(jìn)行故障樹(shù)下級(jí)節(jié)點(diǎn)的故障診斷。直到遍歷到預(yù)設(shè)故障樹(shù)的底層葉子節(jié)點(diǎn),即可把故障隔離至故障樹(shù)的葉子節(jié)點(diǎn)(芯片級(jí)或者SRU級(jí));根據(jù)故障節(jié)點(diǎn)的恢復(fù)函數(shù),可以進(jìn)行全面的故障恢復(fù)。
BIT系統(tǒng)功能性設(shè)計(jì)包括BIT檢測(cè)的類(lèi)型、時(shí)機(jī)、檢測(cè)內(nèi)容以及檢測(cè)結(jié)果的處理。BIT接口及功能如表3所示。
表3 BIT接口及功能
加電BIT(PBIT)用于系統(tǒng)上電過(guò)程中,系統(tǒng)初始硬件狀態(tài)和軟件加載項(xiàng)的檢測(cè),包括部分RE_BIT和UN_BIT。模塊在初始加載,應(yīng)用加載前,PBIT作為系統(tǒng)初始啟動(dòng)過(guò)程自動(dòng)運(yùn)行,在模塊上電時(shí)進(jìn)行測(cè)試,并將測(cè)試結(jié)果保存在模塊中,并上傳測(cè)試信息。
周期BIT(CBIT)用于系統(tǒng)正常運(yùn)行時(shí),對(duì)綜合電子系統(tǒng)模塊健康狀態(tài)進(jìn)行連續(xù)的在線檢測(cè)。周期BIT的運(yùn)行不影響系統(tǒng)正常功能的執(zhí)行。當(dāng)周期BIT檢測(cè)到影響可能會(huì)系統(tǒng)正常工作的故障時(shí),通過(guò)人機(jī)提示接口提示到人機(jī)界面。周期BIT的檢測(cè)結(jié)果保存在模塊中,可以主動(dòng)上傳測(cè)試信息。
維護(hù)BIT(IBIT)用于故障診斷、故障隔離,并提供了較為完善的故障恢復(fù)手段。作為故障診斷的主要部分用于檢查模塊軟硬件的狀態(tài)。為了在故障定位期間有幫助,IBIT執(zhí)行模塊的全面的測(cè)試。在模塊運(yùn)行中根據(jù)HK_BIT或RE_BIT的指令對(duì)模塊進(jìn)行測(cè)試,將測(cè)試結(jié)果存儲(chǔ)在模塊中,上傳測(cè)試信息或由系統(tǒng)獲取。
系統(tǒng)運(yùn)行時(shí),PBIT、CBIT、IBTI由 HK_BIT 服務(wù)下發(fā)BIT檢測(cè)命令,各個(gè)模塊內(nèi)部的RE_BIT服務(wù)解析該指令,并進(jìn)行模塊級(jí)和單元級(jí)的BIT檢測(cè)。RE_BIT和UN_BIT的所有節(jié)點(diǎn)設(shè)計(jì)包括節(jié)點(diǎn)名稱(chēng)、BIT屬性、探測(cè)函數(shù)、恢復(fù)函數(shù)、節(jié)點(diǎn)標(biāo)志位、節(jié)點(diǎn)遍歷值等節(jié)點(diǎn)屬性的統(tǒng)一數(shù)據(jù)結(jié)構(gòu)。在故障樹(shù)遍歷時(shí),僅需對(duì)比各探測(cè)項(xiàng)(節(jié)點(diǎn))是否具有PBIT、CBIT、IBTI屬性,以此判斷是否需要對(duì)該節(jié)點(diǎn)進(jìn)行探測(cè);同時(shí),統(tǒng)一設(shè)計(jì)的節(jié)點(diǎn)數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)于數(shù)據(jù)庫(kù)中,實(shí)現(xiàn)故障樹(shù)遍歷算法與故障樹(shù)、探測(cè)函數(shù)的分離,后續(xù)修改、刪減BIT探測(cè)項(xiàng)僅需通過(guò)數(shù)據(jù)庫(kù)維護(hù)即可。同時(shí)3種BIT檢測(cè)均預(yù)留軟件接口,可以完成與自動(dòng)測(cè)試設(shè)備(ATE)的對(duì)接。
建立了分布式基型火控系統(tǒng)分層級(jí)的BIT架構(gòu),首次將火控系統(tǒng)測(cè)試能力從LRU級(jí)提高至SRU級(jí)。設(shè)計(jì)了易于維護(hù)的通用PBIT、CBIT、IBIT節(jié)點(diǎn)屬性的統(tǒng)一數(shù)據(jù)結(jié)構(gòu),引入故障樹(shù)理論設(shè)計(jì)了通用自動(dòng)遍歷故障樹(shù)測(cè)試算法。該故障樹(shù)遍歷算法與故障樹(shù)、節(jié)點(diǎn)數(shù)據(jù)結(jié)構(gòu)相分離,使得基型火控系統(tǒng)BIT在跨平臺(tái)應(yīng)用時(shí),僅需建立新的基型火控系統(tǒng)的故障樹(shù)和數(shù)據(jù)庫(kù)中的節(jié)點(diǎn)數(shù)據(jù)結(jié)構(gòu),即可實(shí)現(xiàn)基型火控系統(tǒng)BIT的跨平臺(tái)應(yīng)用。在某預(yù)研項(xiàng)目的應(yīng)用表明,方案合理可行,易于維護(hù),可顯著提高火控系統(tǒng)的測(cè)試性和可靠性。
[1]劉少偉,鄭文榮.BIT技術(shù)發(fā)展與應(yīng)用研究[J].理論與方法,2011,7(5):23-26.
[2]王厚軍.可測(cè)性設(shè)計(jì)技術(shù)的回顧與發(fā)展綜述[J].中國(guó)科技論文在線,2008,3(3):52-58.
[3]張小林,劉海彬.電子系統(tǒng)BIT設(shè)計(jì)技術(shù)初探[J].中國(guó)測(cè)試技術(shù),2008,34(3):80-83.
[4]王勇.機(jī)內(nèi)測(cè)試技術(shù)的發(fā)展與應(yīng)用[J].飛航導(dǎo)彈,2011,31(2):24-27.
[5]胡瑜,韓銀,李曉維.SoC可測(cè)試性設(shè)計(jì)與測(cè)試技術(shù)[J].計(jì)算機(jī)研究與發(fā)展,2005,42(1):153-162.
[6]張萬(wàn)君,李靜陽(yáng),牛敏杰,等.坦克火控系統(tǒng)故障的多線程數(shù)據(jù)采集方法[J]. 兵器裝備工程學(xué)報(bào),2016,36(11):44-48.
Design for Fire Control System BIT
ZHAO Gang1,REN Yong-sheng2,LIU Rui1,SUN Zhan1,KONG Xiu-wen1
(1.North Automatic Control Technology Institute,Taiyuan030006,China;2.Beijing Army Representatives Bureau,Beijing 100012,China)
The design model of system-level and module-level BIT system are established based on hierarchical BIT design.The unified data structure of PBIT,CBIT,IBIT test item including detection function and recovery function are designed.Fault tree theory is introduced to BIT system and the PBIT,CBIT,IBIT universal automatic traversal fault tree test algorithm is designed,which can realize the bottom-up node test of integrated electronic system and top-down fault diagnosis.In a general fire control system advanced project application show that the scheme of online health monitoring and fault diagnosis based on BIT is reasonable and feasible,easy to maintain,and can improve general fire control system testability and reliability.
BIT,fault tree,fire control system test
E92;TP273
A
10.3969/j.issn.1002-0640.2017.11.35
1002-0640(2017)11-0165-04
2016-09-09
2016-11-07
趙 剛(1974- ),男,山西陽(yáng)泉人,研究員。研究方向:火控系統(tǒng)總體技術(shù)。