楊新星,秦 赟,奚 俊,張志強
(1. 海軍裝備部駐南京地區(qū)第二軍事代表室,南京 211153;2. 中國船舶集團有限公司第八研究院,南京 211153)
隨著武器裝備性能的日益提高及技術的快速發(fā)展,測試性受到越來越多的重視。GJB2547A-2012《裝備測試性通用工作》中對測試性的定義:產品能及時、準確地確定其狀態(tài)(可工作,不可工作,性能下降)和隔離其內部故障的一種設計特性。[1]
作為裝備的一種設計特性,測試性具有與通用質量特性中可靠性、維修性、保障性、安全性等同等重要的位置,是構成武器裝備質量特性的重要組成部分。良好的測試性分析與診斷能力是確保裝備戰(zhàn)備完好性、任務成功性的重要中間環(huán)節(jié)。
在目前的裝備測試性設計過程中普遍存在以下問題:測試設計簡單、故障檢測率不高;測試點設計冗余、基本可靠性影響過大、資源費用浪費;測試點類型設計不合理、故障隔離率低。這些問題嚴重制約了裝備的戰(zhàn)備完好性、任務成功性。
本文研究了基于多信號模型的測試性建模仿真分析方法,并應用測試性分析軟件TMAS,對典型裝備進行了測試性建模、仿真與分析,為裝備的測試性設計的提高提供了一種定性、定量分析支持方法。
測試性設計技術的快速發(fā)展經歷了由外部測試到機內測試(Built-in Test,BIT)、智能BIT到綜合診斷直至目前先進的預測與健康管理的發(fā)展過程。測試性設計是為了提高產品自診斷和外部診斷能力,能方便、有效地確定產品狀態(tài)和隔離故障。測試性是產品的一種設計特性,是伴隨功能原理設計時賦予產品的一種固有屬性。
測試性設計技術主要有以下幾種[2]:(1)固有測試性;(2)機內測試;(3)外部自動測試;(4)人工測試;(5)綜合診斷;(6)健康管理。
目前,(1)~(4)項設計為常規(guī)測試性設計,其中固有測試性和BIT為目前裝備設計的重點,外部自動測試和人工測試根據(jù)裝備使用環(huán)境、裝備測試條件等選擇使用;(5)~(6)項是對現(xiàn)有測試性設計技術的重要擴展,也是裝備測試性設計的發(fā)展研究方向。
本文研究的測試性建模仿真分析技術主要針對設計技術對象為固有測試性、BIT,以及用戶可實現(xiàn)的人工測試和部分綜合診斷。
測試性設計的性能參數(shù)有故障檢測率、關鍵故障檢測率、故障覆蓋率、故障隔離率、虛警率、平均虛警間隔時間、平均故障檢測時間、平均故障隔離時間、平均診斷時間、平均BIT運行時間、誤拆率、不能復現(xiàn)率等[2],其中裝備常用的測試性參數(shù)主要有:
(1) 故障檢測率是指在規(guī)定的時間內用規(guī)定的方法正確檢測到的故障數(shù)與被測單元發(fā)生的故障總數(shù)之比;
(2) 故障隔離率是指在規(guī)定的時間內用規(guī)定的方法正確隔離到不大于規(guī)定的可更換單元數(shù)的故障數(shù)與同一時間內檢測到的故障數(shù)之比;
(3) 虛警率是指在規(guī)定的工作時間內發(fā)生的虛警數(shù)與同一時間內的故障指示總數(shù)之比。
本文研究的測試性建模仿真分析技術可分析預計的參數(shù)主要為故障檢測率和故障隔離率。
作為一項重要的測試性設計工作內容,建立測試性模型包含在GJB 2547A-2012《裝備測試性通用工作》的測試性設計與分析工作項目要求中,其目的是建立產品的測試性模型,用于分配、預計、設計和評價產品的測試性。[1]
在模型建立的基礎上,可通過測試性仿真軟件進行測試性輔助設計及仿真評價。測試性建模分析工作應在裝備系統(tǒng)的初步設計階段開展,隨著設計的深入應該逐步迭代該項工作,不斷細化模型以反映系統(tǒng)的變化。在初步設計階段可通過建模仿真預計結果調整方案階段測試性指標的分配,而在詳細設計階段可用于指導對測試性設計的優(yōu)化。通過對測試點及測試方法的不斷去冗余、增加必要測試等優(yōu)化設計,或者發(fā)現(xiàn)系統(tǒng)功能結構流程中的問題進行調整修改和重新劃分設計等工作,不斷完善設計迭代仿真,直至仿真預計結果滿足總體或任務書對測試性故障檢測率和故障隔離率指標的要求,給出仿真條件下裝備測試性評價,利用診斷策略可以直接建立用于BIT或ATE的診斷算法,或者用于人工測試的診斷流程。
美國DSI公司的創(chuàng)始人De Paul從20世紀60年代開始首先將相關性模型應用于裝備的診斷開發(fā)。相關性模型是一種以相關性推理為基礎按照故障如何被發(fā)現(xiàn)的過程來設計故障檢測和隔離的方法,可以直接用于解決故障檢測和隔離問題。
基于相關性的模型主要有相關性圖示模型和相關性數(shù)學模型。相關性圖示模型可以直觀地圖形化展示單元與測試之間的關系,而相關性數(shù)學模型則是用D矩陣方式描述了單元與測試之間的相關性。相關性圖示模型、相關性數(shù)學模型示意圖如圖1所示。
圖1中信號流比較簡單,單元模塊的故障模式F也比較單一,且故障模式F未設置功能概念,因此引入多信號模型(Multi-Signal Model)的概念。多信號模型為目前相關性圖示模型中的一種常用模型, 也是常用測試性分析軟件的基礎模型,采用圖1相關性圖示模型中的帶箭頭指示的線段描述故障傳遞關系。考慮到多種故障模式,每種故障模式可以看成一種單一信號,故稱為多信號模型。只需要對故障模式如何傳遞到各個測試點進行建模,并把故障模式分為功能故障和完全故障2種類型。[3]
圖1 相關性圖示、數(shù)學模型示意圖
多信號模型圖形化表示了裝備的組成、結構層次、多信號流程、多種故障模式、功能等,將一組單信號的傳遞過程附加到結構模型上。所以,模型與系統(tǒng)原理流程圖密切相關,更加接近于系統(tǒng)的物理結構。此外,由于模型中的信號是獨立的,信號之間不會相互影響。這些特征使得多信號流圖模型建模簡單、模型的集成和驗證都相對簡單[4],特別適用于大型復雜系統(tǒng)。
目前,國內最具代表性的基于相關性模型的測試性分析工具是北京航空航天大學可靠性工程研究所的測試性建模與分析系統(tǒng)(Testability Modeling and Analysis System,TMAS)。
TMAS集測試性建模、測試性分析和診斷推理三大功能于一體,可廣泛地應用于大型復雜電子、機械、機電系統(tǒng)等復雜系統(tǒng)的測試性設計與分析,可快速地建立符合相關性理論和多信號流圖的層次化圖形模型,并快捷完成分析、修改再分析工作。
通過測試性分析,TMAS可輸出模型組成、模型匯總、故障源匯總、測試匯總、模型統(tǒng)計參數(shù)等建模匯總類信息;同步完成對裝備的定性分析和定量分析,其中定性分析是指對不可檢測故障、故障模糊組情況、冗余測試、反饋環(huán)、隱蔽故障等的分析。定量分析是指對測試性參數(shù)故障檢測率和故障隔離率的分析。同時,TMAS還可輸出圖形或表格形式的診斷策略用于BIT或ATE的診斷算法建立和人工測試的診斷流程,并提供了D矩陣的自動化生成功能供設計師進行相關性數(shù)學模型的測試性分析。此外,測試性分析還能提出針對裝備原有測試性設計不足的建議,分析結果便于下一步的測試性改進設計。
應用以上測試性基礎研究及模型理論研究的成果,對某裝備進行了測試性設計的建模仿真分析實例化操作。針對該裝備TMAS測試性建模分析的主要流程如下:
(1) 資料收集
在進行測試性建模前,首先要進行相關信息的收集,主要包括:(1)該裝備整機、分系統(tǒng)、模塊等各個層次的可用設計信息,如裝備研制總要求中規(guī)定的測試性指標要求;(2)整機、分機方案中設計的組成結構層次、功能原理流程、測試性指標預計值;(3)各層級FME(C)A分析結果等。本分析實例考慮故障率情況下的分析,還收集了各模塊可靠性預計數(shù)據(jù)??紤]維修性相關分析還需收集操作說明、維護信息等。但是,這些不是測試性分析所必需的,本分析實例暫未考慮維修性相關分析。
(2) 故障模式與測試方法分析
在收集的資料尤其是FME(C)A分析結果的基礎上,結合故障的相關信息在系統(tǒng)級別、分系統(tǒng)級別、模塊級別依次開展測試性分析。分析內容主要包括故障模式、測量參數(shù)/測試點、測試方法的選擇等,形成了基于FME(C)A分析的測試性信息分析報告。
分析中需注意裝備各層次均應進行故障模式與測試方法分析以獲取測試性設計信息。分析工作是逐步深入和細化的過程,經過了多輪反復迭代。該流程步驟是整個建模仿真分析的核心重點。輸出的故障模式、測量參數(shù)、測試點(測試部位)、測試內容、測試方法等測試性信息是測試性仿真分析的基礎數(shù)據(jù)。它們的詳細、準確程度直接決定了仿真分析的結果。
值得說明的是,測試性設計中模塊級故障模式分析更多的應該還是從功能故障模式去考慮。這其中涉及測試性設計是采用基于功能或數(shù)據(jù)流的測試還是基于硬件故障的測試方法選擇。選擇不是絕對的,而是根據(jù)具體情況?;诠δ芑驍?shù)據(jù)流的測試往往比較復雜,但直接反映故障模式?;谟布收系臏y試簡單,但往往間接反映故障模式,而且多故障原因下容易測試不全面導致漏報。
(3) 層次化建立裝備的結構模型
根據(jù)裝備收集到的組成結構層次框圖以及要求測試性分析的層次深度建立裝備的系統(tǒng)結構層次化模型。TMAS系統(tǒng)的層次化模型支持System、Subsystem、LRU、SRU、Module、Component、FailureMode幾個層次,并可用戶自定義層次配置。根據(jù)裝備測試性指標要求的級別以及裝備設計常用的劃分靈活配置。本次分析的裝備測試性指標要求檢測隔離到LRU級,則選擇了System、Subsystem、Cabinet(自定義)、LRU、FailureMode層次,對應整機、分系統(tǒng)、分機/插箱、可更換單元模塊、故障模式共5個層次?;AFailureMode層次為LRU級FME(C)A分析的故障模式結果。
(4) 添加模塊、故障模式、功能
根據(jù)收集到的組成結構層次框圖,以及FME(C)A的分析結果,在TMAS中圖示化建立層次,分析層次下添加功能模塊、在功能模塊下添加分析對應的故障模式。在TMAS中層次、模塊、故障模式均由“模塊”圖元實現(xiàn),在設置中選擇屬性加以區(qū)分。層次、模塊必須設置名稱、端口信息;故障模式必須設置名稱、端口信息、可靠性參數(shù)(含嚴酷度等級),選擇性設置功能、維修性技術數(shù)據(jù)、自測試等相關信息。
TMAS中的功能為一種特殊的信號:關聯(lián)了某一功能的故障源只能被同樣關聯(lián)了該功能的測試檢測到,而不能被沒有關聯(lián)該功能的測試檢測到。簡單理解可以將功能理解為具有特定處理的功能,而且可以設置專門對應的測試來檢測該功能的失效??稍谀K或故障模式設置界面中添加功能,并將其關聯(lián)到故障模式中去。
(5) 在模塊、故障模式間建立信號流連接
根據(jù)收集到的整機、分機功能原理流程圖在模塊之間添加單向信息流連線,使各個模塊實現(xiàn)互聯(lián)。此連線表示模塊之間的信息傳遞關系,故障模式、功能可以通過連線進行傳播,而且多種功能可以通過同一連線進行傳播。
在此需要注意的是,建模所需的信息流程圖能表明裝備系統(tǒng)中主要信息流轉的過程即可,與實際裝備系統(tǒng)多類型復雜連線要有區(qū)別。主要考慮滿足故障模式沿該信息流傳播(故障對當前信息流造成影響)的需求,不能劃分太粗,導致故障模式影響到本不會影響的信號,影響建模分析的結果;也不能劃分太細,導致無謂的浪費、增加建模的難度及工作量。
(6) 添加測試點及測試
根據(jù)實際情況設置測試點。測試點指的是實際工程中設計、執(zhí)行測試的位置。在同一個測試點可以執(zhí)行多種測試。測試方法類型是必須設置的,可選擇性設置測試費用、測試時間等。在TMAS中提供了兩種測試點,即普通測試點與限定性測試點。兩種測試點的分析結果有所區(qū)別。限定性測試點中的測試如果關聯(lián)了某功能,則該測試只能測到關聯(lián)了相同功能的故障源,而測不到未關聯(lián)任何功能的故障源以及關聯(lián)了不同功能的故障源。普通測試點中的測試如果關聯(lián)了某功能,則該測試能測到關聯(lián)了相同功能的故障源以及未關聯(lián)任何功能的故障源,而測不到關聯(lián)了不同功能的故障源。簡單理解可以認為普通測試點基于故障模式數(shù)據(jù)流傳遞的測試,限定性測試點可以用于一些專有功能測試的情況。在使用選擇時可靈活把握選用原則,一種典型的選擇原則是基于數(shù)據(jù)流的測試可選擇普通測試點,基于具體故障的測試可選擇限定性測試點。
(7) 測試性自動分析及人工分析
模型建立完成后進行數(shù)據(jù)校核,確認無誤后可進行測試性自動分析。選擇分析范圍、隔離層次、分析所用的測試類型;是否分析未檢測故障、模糊組、冗余測試等;設置工作模式和配置的選擇分析何種模式。軟件可自動分析給出相關結果,主要如下:
? 建模匯總類信息:模型組成、模型匯總、故障源匯總、測試匯總、模型統(tǒng)計參數(shù)等;
? 定性分析:不可檢測故障、故障模糊組、冗余測試、反饋環(huán)、隱蔽故障等;
? 定量分析:測試性參數(shù)故障檢測率和故障隔離率(分別隔離到1、2、3個LRU)的分析結果;
? 圖形或表格形式的診斷策略(故障診斷二叉樹);
? D矩陣信息。
圖2~4展示了本分析實例的部分仿真結果。
圖2 測試性圖形建模結果
(8) 模型修正和迭代分析
建立復雜電子系統(tǒng)的測試性模型通常需要根據(jù)實際情況進行修正。下面列出幾種經常遇到的情況及修正方法:
? 如果一個系統(tǒng)存在冗余結構,可應用相關性模型的一個基本假設:“在任何時刻當被測單元處于故障狀態(tài)時,認為只有一個組成單元發(fā)生了故障,即單故障假設”[2],結合建模分析的基本原理是故障在傳遞過程中的檢測性,將冗余結構簡單進行并聯(lián)建模,即單一故障即全故障,同時在故障模式的可靠性參數(shù)中將嚴酷度等級下調;
? 如果一個系統(tǒng)有不同的運行模式,則使用“工作模式和配置”選項進行建模,分析時可針對不同工作模式單獨分析;
? 反饋環(huán)即電路中的閉環(huán)設計,它將導致不可解決的故障模式模糊集合,需分析修正結構、流程以避免不必要的反饋環(huán)設計;
? 不可檢測故障指利用現(xiàn)有測試不能檢測的故障模式;冗余測試指具有相同特征(即檢測同一個故障模式集)的測試。需仔細分析,通過增加、刪除、修改測試點等措施加以修正;
? 故障模糊組指一組具有相同可觀測特征的故障模式集合,故障模糊組直接導致故障隔離率的降低,需分析產生原因,選擇性地通過調整測試點、修改信號流程等措施改進設計。
針對本分析實例的仿真結果進行分析:
(1) 將測試性圖形建模結果(圖2)、D矩陣結果與相關性圖示、數(shù)學模型示意圖(圖1)進行對比,可以看出:在建模中每個模塊均考慮了多種故障模式,信號流也多種多樣,故障模式中也對應設置了功能模式。借助生成D矩陣信息,還可人工進行相關性數(shù)學模型的測試性分析。
(2) 故障診斷二叉樹(圖4)直觀地以圖形形式表達了當前建模的診斷策略,根據(jù)每一步測試結果進行下一步的診斷測試,直至進行到底層事件,即最終故障診斷結果。人工查看該診斷策略是否符合實際裝備設計,最終結果用于BIT或ATE的診斷算法建立和人工測試的診斷流程。在本實例結果圖中明顯可看到下方底層事件有模糊度為3的故障模糊組。
圖4 故障診斷二叉樹
(3) 從測試性建模仿真結果(圖3)可以看出,該分系統(tǒng)檢測率及隔離率都不高。設計師可具體查看不可檢測故障及模糊組等具體報告子項了解具體問題。
圖3 檢測率、隔離率、不可檢測故障等仿真結果
結合TMAS軟件提供的一種特殊的DFT模式,查看模型故障源信號傳播路徑以及故障、測試之間傳遞關聯(lián)建立不當問題。分析不可檢測故障產生的原因,是故障傳遞流程設置錯誤、測試點位置設置錯誤、測試類型設計錯誤還是實際工程中本故障就難以測試等等,針對性地加以修正改進設計。本例中網絡模塊原設計考慮只是一個對外接口傳輸通道,不方便檢測,改進設計時可借由主機模塊的初始化設置上電BIT,開機過程中利用板卡狀態(tài)與外部數(shù)據(jù)流綜合判斷的周期BIT,以達到模塊的可檢測。雙冗余電源原本設計是考慮沒有供電,主機模塊無法檢測故障,改進設計可考慮電源的冗余性,互相支持檢測,輔以人工檢測電源指示燈的方法實現(xiàn)模塊的可檢測。
分析模糊組及反饋環(huán)等主要子項報告,查找形成原因并消除,即可提升隔離率指標。本例中視頻發(fā)送模塊、光纖接口模塊、電源為模糊組,分析后主要原因為:(1)電源只設計了指示燈檢測點,分析隔離率時未將該人工測試類別加入分析,非設計原因;(2)視頻信息由視頻發(fā)送模塊傳輸至光纖接口模塊,經接口轉換后再輸出。原測試設計采用了在光纖接口模塊輸出端設置檢測數(shù)據(jù)流的測試方法,無法定位視頻無輸出故障具體是由兩個模塊中哪一個導致,模糊度為2。針對第2個原因,優(yōu)化測試點設計,在前端視頻發(fā)送模塊增加設置測試點,測試前端視頻發(fā)送模塊送出的視頻數(shù)據(jù)流,或者當前端無法設置測試點時可在后端光纖接口模塊增加基于功能的測試點(該功能定義為“前端視頻發(fā)送模塊輸出”,即在數(shù)據(jù)流中設計專門的前端數(shù)據(jù)流特征標識用于區(qū)分前端后端數(shù)據(jù)),均可以將模糊度提高為1。
經過以上分析處理,該分系統(tǒng)自身的檢測隔離率指標均達到100%(基于當前分析的基礎故障模式數(shù)據(jù)條件下)。通過對測試點及測試方法的增加必要測試、設置功能測試、去冗余、等優(yōu)化設計,或者發(fā)現(xiàn)系統(tǒng)功能結構流程中的問題進行調整修改和重新劃分設計等工作,不斷模型修正、迭代仿真,直至仿真預計結果滿足總體或任務書對測試性故障檢測率和故障隔離率指標的要求。
本文介紹了基于多信號相關性圖示模型的TMAS軟件測試性建模仿真技術與應用研究過程,主要包括:
(1) 研究了測試性設計技術、測試性主要參數(shù);
(2) 研究了測試性建模的相關性模型基礎;
(3) 基于相關性模型中典型的多信號模型,實際應用TMAS軟件對某裝備進行了測試性建模仿真分析,研究了TMAS測試性建模仿真分析技術流程及每個步驟的重點關注事項。
通過對模型理論研究以及對仿真分析流程的構建研究,初步實現(xiàn)了對真實裝備測試性設計的建模仿真分析,評估了裝備目前的測試性設計水平,發(fā)現(xiàn)并解決了部分測試性設計問題,為裝備的測試性設計提高提供了一種定性定量分析支持方法,有益于裝備維修性、可靠性等的設計提高,對提升裝備的戰(zhàn)備完好性、任務成功性具有重要的意義。