沈顯照
( 中國(guó)電子科技集團(tuán)公司第38 研究所,合肥 230031)
隨著現(xiàn)代雷達(dá)的發(fā)展,雷達(dá)功能不斷增強(qiáng),系統(tǒng)的復(fù)雜性不斷提高,這對(duì)雷達(dá)系統(tǒng)的可靠性,可維護(hù)性和可操作性等技術(shù)指標(biāo)提出了更高的要求。在雷達(dá)的研制過(guò)程中,對(duì)于可靠性可以采用一些有效的技術(shù)來(lái)提高,但由于元器件老化失效、外部環(huán)境劣化等各種因素的限制,可靠性不可能無(wú)限制地提高。作為雷達(dá)系統(tǒng)研制的一種優(yōu)化方案,在雷達(dá)系統(tǒng)可靠性一定的前提下適當(dāng)增加可靠的冗余設(shè)備和檢測(cè)設(shè)備,以便提高雷達(dá)的可靠性和可維護(hù)性,為此,現(xiàn)代雷達(dá)中進(jìn)行了可測(cè)試性設(shè)計(jì)( DFT,design for testability)。在現(xiàn)有的DFT方案中,常用的有邊界掃描( BS,boundary scan)技術(shù)和內(nèi)建測(cè)試( BIT,built-in test)技術(shù)[1]。前者常用于互連測(cè)試,后者側(cè)重于功能測(cè)試。具體來(lái)說(shuō),BIT 是提高電路系統(tǒng)可靠性并減少系統(tǒng)維護(hù)費(fèi)用的關(guān)鍵技術(shù)。它通過(guò)附加在電路系統(tǒng)內(nèi)的軟件和硬件對(duì)電路系統(tǒng)進(jìn)行在線故障自檢測(cè)[2]。通過(guò)在系統(tǒng)中加入BIT,可以達(dá)到屏蔽故障影響、提高系統(tǒng)可靠性的目的。完善的BIT 設(shè)計(jì)是實(shí)現(xiàn)系統(tǒng)級(jí)可靠性技術(shù)的關(guān)鍵,它還是實(shí)現(xiàn)故障容錯(cuò)和重構(gòu)的基礎(chǔ)。
機(jī)內(nèi)測(cè)試的目的在于提高系統(tǒng)和設(shè)備的戰(zhàn)備完好性和任務(wù)成功性,減少對(duì)維修人員和其它資源的要求,降低壽命周期費(fèi)用,并為管理提供必要的信息。
機(jī)內(nèi)測(cè)試是通過(guò)附加在電路系統(tǒng)內(nèi)的軟件和硬件對(duì)電路系統(tǒng)進(jìn)行在線( on -line)的故障自檢測(cè)[3],將測(cè)試手段嵌入到武器系統(tǒng)之中,成為系統(tǒng)的組成部分,因此也稱(chēng)為機(jī)內(nèi)測(cè)試設(shè)備( BITE)。這是近年來(lái),逐漸尋找到的提高武器系統(tǒng)的測(cè)試性和作戰(zhàn)效能的最為有效的技術(shù)途徑,是提高電路系統(tǒng)可靠性并減少系統(tǒng)維護(hù)費(fèi)用的關(guān)鍵技術(shù)[4-5]。采用BIT技術(shù)的優(yōu)點(diǎn)在于,它最容易實(shí)現(xiàn)武器系統(tǒng)在工作過(guò)程中的實(shí)時(shí)監(jiān)視,從而能最有效地保證武器系統(tǒng)的作戰(zhàn)能力的發(fā)揮。
由于軍用電子裝備對(duì)質(zhì)量和可靠性要求很高,因而測(cè)試設(shè)備對(duì)軍用武器裝備的保障具有舉足輕重的作用。對(duì)于BIT系統(tǒng)的模塊必須考慮其通用性,兼容性和標(biāo)準(zhǔn)接口[6-7]。
BIT 的設(shè)計(jì)應(yīng)遵循下列原則:
1)分系統(tǒng)在雷達(dá)中雖處于輔助地位,但卻是全局性的一個(gè)分系統(tǒng)。因而B(niǎo)IT 的設(shè)計(jì)必須從系統(tǒng)的方案論證開(kāi)始,并和系統(tǒng)設(shè)計(jì)同步進(jìn)行。
2)設(shè)置BIT 的目的是通過(guò)檢測(cè),實(shí)現(xiàn)故障定位和性能測(cè)試。因而,BIT 的設(shè)置應(yīng)盡量不影響主通路的工作。當(dāng)機(jī)內(nèi)檢測(cè)可能影響雷達(dá)主通路時(shí),就應(yīng)考慮機(jī)外檢測(cè)。
3)設(shè)置的檢測(cè)要考慮到覆蓋面。特別是在功能塊和關(guān)鍵部件處不影響雷達(dá)主通路的前提下,要保證設(shè)置有相關(guān)測(cè)試點(diǎn),在硬件設(shè)置檢測(cè)點(diǎn)有困難的情況下,盡量考慮用軟件檢測(cè)的方法。并使硬件和軟件二者有機(jī)結(jié)合,以提高檢測(cè)概率。
4)由于雷達(dá)體制和作用的不同,在進(jìn)行方案論證和設(shè)計(jì)過(guò)程中,模塊要考慮到通用性、兼容性和擴(kuò)充性,并使二者有機(jī)結(jié)合。
5)設(shè)計(jì)的模塊要有搭積木的功能。這就要求在進(jìn)行雷達(dá)主通路方案論證和系統(tǒng)或分系統(tǒng)設(shè)計(jì)時(shí),要給模塊設(shè)計(jì)留有足夠的空間。
在設(shè)計(jì)BIT 系統(tǒng)時(shí),必須考慮到它的技術(shù)指標(biāo),因?yàn)樗鼘?shí)際上表示了BIT 系統(tǒng)的檢測(cè)和故障隔離的能力。技術(shù)指標(biāo)的確定與所采用的BIT 檢測(cè)方式等因素有關(guān),BIT 的主要指標(biāo)[8]有:故障檢測(cè)率、故障隔離率、虛警率、故障隔離出錯(cuò)率、故障發(fā)現(xiàn)時(shí)間、故障隔離時(shí)間。
常用的是故障檢測(cè)率,虛警率,故障發(fā)現(xiàn)時(shí)間這三個(gè)指標(biāo)。
對(duì)于BIT 系統(tǒng)的設(shè)計(jì)是采用分布式檢測(cè),集中式控制和處理的多機(jī)系統(tǒng)。雷達(dá)系統(tǒng)是個(gè)串聯(lián)系統(tǒng),任一地方出現(xiàn)的故障并不完全孤立的,只有匯集系統(tǒng)的整個(gè)信息并加以綜合,才能確定故障的位置或其性能指標(biāo),才能提高檢測(cè)概率,降低系統(tǒng)的虛假概率,改善系統(tǒng)的維修性,提高系統(tǒng)的可用度。
雷達(dá)BIT 的硬件一般由4 個(gè)部分的電路組成:采樣和檢測(cè)、接口緩沖、主控、人機(jī)接口。其框圖見(jiàn)圖1。
圖1 BIT 系統(tǒng)框圖
采樣和檢測(cè)電路分布于雷達(dá)各分機(jī)系統(tǒng)內(nèi),主要完成對(duì)各分機(jī)內(nèi)關(guān)鍵信號(hào)的采集、轉(zhuǎn)換處理和狀態(tài)識(shí)別。
從20 世紀(jì)90年代開(kāi)始,出現(xiàn)了以數(shù)字波形采集和處理技術(shù)為核心的微機(jī)多功能在線監(jiān)測(cè)系統(tǒng),該系統(tǒng)利用先進(jìn)的傳感器技術(shù)、計(jì)算機(jī)技術(shù)和數(shù)字波形采集與處理等高新技術(shù),實(shí)現(xiàn)更多的參數(shù)在線監(jiān)測(cè)[9-11]。在線狀態(tài)監(jiān)測(cè)系統(tǒng)實(shí)現(xiàn)了數(shù)據(jù)采集,數(shù)據(jù)處理、狀態(tài)識(shí)別、數(shù)據(jù)庫(kù)等各項(xiàng)功能,其原理如圖2 所示。檢測(cè)傳感器是在線監(jiān)測(cè)系統(tǒng)的入口器件,其靈敏度和性能的優(yōu)劣直接影響測(cè)量精度,進(jìn)而使數(shù)據(jù)處理產(chǎn)生大的誤差,監(jiān)測(cè)系統(tǒng)能夠正確運(yùn)行的前提就是要求傳感器靈敏、可靠、線性度好,能夠不失真的轉(zhuǎn)換被測(cè)信號(hào)。
圖2 在線檢測(cè)原理
接口及緩沖處理模塊由遠(yuǎn)程收發(fā)、光電隔離、緩沖處理、譯碼驅(qū)動(dòng)等電路組成,它構(gòu)建了一個(gè)良好的輸入、輸出接口通道,從而保障了BIT 主控機(jī)與數(shù)據(jù)采樣電路之間可靠的數(shù)據(jù)通訊/交換。其原理如圖3 所示。
圖3 接口緩沖電路原理
主控模塊是BIT 系統(tǒng)的核心,主要完成對(duì)各功能模塊的控制,并對(duì)前端送來(lái)的故障數(shù)據(jù)進(jìn)行處理,綜合各種信息,給出最終的故障診斷結(jié)果。
在設(shè)計(jì)的某雷達(dá)系統(tǒng)中,主控處理原則上是建立在雷達(dá)分布式多微機(jī)系統(tǒng)基礎(chǔ)上,采用分散測(cè)試和集中處理、顯示的三級(jí)層次結(jié)構(gòu),第一層:為整個(gè)雷達(dá)系統(tǒng)的主控層,實(shí)現(xiàn)雷達(dá)系統(tǒng)各種信息的集中管理和顯示,具有良好的人機(jī)交互能力。其硬件是由光柵顯示插件板和微型計(jì)算機(jī)模塊組成。第二層:為通信鏈路層,主要將主控計(jì)算機(jī)發(fā)送來(lái)的控制命令按要求發(fā)送到特定的串口,相應(yīng)的下位控制計(jì)算機(jī)負(fù)責(zé)具體得命令解釋;收集各下位計(jì)算機(jī)上報(bào)的雷達(dá)系統(tǒng)狀態(tài)、故障信息轉(zhuǎn)發(fā)給主控層的主控計(jì)算機(jī)。其硬件由計(jì)算機(jī)插件、通信接口插件組成,最多可實(shí)現(xiàn)8 個(gè)串口的通信管理能力。第三層:為設(shè)備層,主要接收通信鏈路層發(fā)來(lái)的控制命令并具體解釋執(zhí)行,產(chǎn)生相應(yīng)控制信號(hào); 對(duì)雷達(dá)系統(tǒng)的各故障信號(hào)進(jìn)行采集并通過(guò)通信鏈路層上報(bào)給主控計(jì)算機(jī)。這層控制根據(jù)BITE 簡(jiǎn)化設(shè)計(jì)的原則盡可能利用各分系統(tǒng)的計(jì)算機(jī)處理能力,如信號(hào)處理的單片機(jī)、終端系統(tǒng)本身的計(jì)算機(jī),它們通過(guò)串口通訊與第二層通信鏈路層進(jìn)行信息交換,而對(duì)接收、天饋、發(fā)射等系統(tǒng)則由測(cè)控接口插件將監(jiān)控信息轉(zhuǎn)換為約定的接口信號(hào),通過(guò)第二層送第一層主控計(jì)算機(jī)。
人機(jī)接口由監(jiān)控顯示屏和操控按鍵組成,可顯示雷達(dá)各分機(jī)系統(tǒng)故障診斷結(jié)果并接受人工干預(yù),從而完成BIT 主機(jī)與操作人員之間的人機(jī)交流。
利用故障樹(shù)建立雷達(dá)故障方程。故障樹(shù)建立的最終目的是為了得到最小割集,通常使用下行法。這種算法是沿故障樹(shù)自上往下進(jìn)行,即從頂事件開(kāi)始,依次將上層事件置換成下層事件,遇到“與”關(guān)系將輸入橫向?qū)懗?,遇到“或”關(guān)系將輸入豎向?qū)懗?,直到底事件全部置換為止。故障樹(shù)建立過(guò)程是通過(guò)對(duì)故障的因果關(guān)系進(jìn)行邏輯分析,即把結(jié)果放在邏輯關(guān)系的頂部( 頂事件),將原因放在其底部( 底事件),運(yùn)用故障樹(shù)分析的方法,由因到果,自頂?shù)降走M(jìn)行分析,最終建樹(shù),并寫(xiě)出故障方程式。
故障樹(shù)的軟件算法實(shí)現(xiàn)采用靜態(tài)順序查找表的方法從表中第一個(gè)記錄開(kāi)始,逐個(gè)進(jìn)行記錄的關(guān)鍵字和給定值的比較,若某個(gè)記錄的關(guān)鍵字和給定值比較相等,則查找成功,找到所查記錄,反之,若直到第n 個(gè)記錄某關(guān)鍵字和給定值比較都不等,則表明表
中沒(méi)有所查記錄,查找結(jié)束。具體步驟如下:
1)對(duì)系統(tǒng)的所有底事件進(jìn)行排隊(duì),建立一個(gè)故障排隊(duì)表,按順序編號(hào)。
2)根據(jù)故障樹(shù)及其得出的故障方程,對(duì)所有“與”關(guān)系( 稱(chēng)具有相關(guān)性)的節(jié)點(diǎn),建立一個(gè)向下相關(guān)故障源表,若是“或”關(guān)系的節(jié)點(diǎn)填空值null。前面已提到這種相關(guān)性原則是本系統(tǒng)中的,但實(shí)際中也局部加入了系統(tǒng)交叉節(jié)點(diǎn),基于BIT 控制器的大存貯量和高運(yùn)算速度,實(shí)現(xiàn)沒(méi)有問(wèn)題。
3)建立一個(gè)故障相關(guān)索引表,它是由相關(guān)源故障表中每一個(gè)故障號(hào)的首地址和相關(guān)源個(gè)數(shù)建立而成的,
4)為使故障相關(guān)定位準(zhǔn)確,又要及時(shí)消除偶然性故障和故障被排除后故障的消失這對(duì)矛盾,采取時(shí)間區(qū)域相關(guān)處理,即BIT 控制器6 次循環(huán)查詢(xún)?nèi)珯C(jī)監(jiān)測(cè)點(diǎn),再2 次進(jìn)行故障樹(shù)的運(yùn)算,最終得到的故障排序表中的保留故障為最終故障,并報(bào)出該故障所有LRU。
BIT 是現(xiàn)代電子產(chǎn)品提高可維修性、縮短平均維修時(shí)間的一種常用手段。雷達(dá)BIT 通過(guò)良好的構(gòu)建和設(shè)計(jì),將測(cè)試單元和可更換單元細(xì)化到印制板,實(shí)現(xiàn)故障檢測(cè)隔離的自動(dòng)化,大大減少了維修資料、通用測(cè)試設(shè)備及維修人員的數(shù)量,在降低費(fèi)用的同時(shí),更保障了產(chǎn)品的可靠性和可維修性。同時(shí),我們不能孤立地去設(shè)計(jì)BIT 系統(tǒng),或者說(shuō),BIT 的設(shè)計(jì)應(yīng)明確包含在系統(tǒng)的設(shè)計(jì)任務(wù)書(shū)中或合同中,必須從最初的方案論證開(kāi)始,采用自上而下,逐步漸進(jìn)的設(shè)計(jì)方法來(lái)進(jìn)行系統(tǒng)設(shè)計(jì)。作為BIT 工程師,必須熟悉雷達(dá)系統(tǒng),并對(duì)整個(gè)雷達(dá)系統(tǒng)的機(jī)內(nèi)測(cè)試信號(hào)及全機(jī)測(cè)試定時(shí)關(guān)系能全面考慮,這對(duì)成功設(shè)計(jì)BIT 系統(tǒng)是非常重要的。
[1]曾天翔.電子設(shè)備測(cè)試性及診斷技術(shù)[M].北京:航空工業(yè)出版社,1996.
[2]Walker R K.Built In Test ( BIT)Utilization for Improved Supportability of the F -20 Aircraft[C]//Proceedings of AUTOTEST-CON’85.New York:IEEE,1985:446-449.
[3]Walker R K.Build In Test ( BIT)Utilization for Improved Supportability of the F-20 Aircraft[J].IEEE AUTOTESTCON,1985.
[4]胡謀. 計(jì)算機(jī)容錯(cuò)技術(shù)[M]. 北京: 中國(guó)鐵道出版社,1995.
[5]曾天翔.綜合診斷的發(fā)展及其在軍用飛機(jī)上的應(yīng)用[J].航空科學(xué)技術(shù),1997(5).
[6]田仲.綜合診斷技術(shù)[J].國(guó)際航空,1996(3):58-59.
[7]楊士元.數(shù)字系統(tǒng)的故障診斷與可靠性設(shè)計(jì)[M].北京:清華大學(xué)出版社,1989.
[8]Lala P L,孟永炎,申曉留.容錯(cuò)與故障可測(cè)性系統(tǒng)設(shè)計(jì)[M].成煌中,譯.北京:中國(guó)鐵道出版社,1989.
[9]Li H,Yang S,Xi H,et al.System Designs for Adaptive,Distributed Network Monitoring and Control[J].IEEE,2001.
[10]Guan J W,Chuan Z,Bell D A.A Framework for Fault Diagnosis in Distributed Expert Systems[J].IEEE,1994.
[11]Errath R A,Dominguez J J.Remote Drive Condition Monitoring[C].IEEE/-IAS/PCA Cement Industry Tech.Conference,1993.