■ 杜時(shí)杰 萇軍紅
隨著眾多新型武器系統(tǒng)研制成功,諸多電子裝備遇到了產(chǎn)能與故障同步提升的問(wèn)題,部隊(duì)官兵對(duì)其可靠性多有怨言,維修部門(mén)對(duì)這些新型復(fù)雜電子裝備,缺少充分的原理認(rèn)知、缺少檢測(cè)維修手段,嚴(yán)重阻礙了當(dāng)前軍事裝備快速發(fā)展的建設(shè)需要。美軍在新型裝備研制合同中均提出了PHM(Prognostics and Health Management,故障預(yù)測(cè)與健康管理)健康管理智能診斷的技術(shù)要求,并進(jìn)行了成功的應(yīng)用。受制于基礎(chǔ)薄弱、技術(shù)成熟度、研制周期、經(jīng)費(fèi)等問(wèn)題制約,我軍裝備至今尚未見(jiàn)到類似的有效應(yīng)用和成果推廣。本文詳實(shí)地分析了當(dāng)前形勢(shì)、問(wèn)題根源,比較了諸多解決方案的利弊,以問(wèn)題為導(dǎo)向,針對(duì)電子產(chǎn)品硬件隨機(jī)失效的自然規(guī)律,充分理解眾多國(guó)軍標(biāo)和國(guó)標(biāo)之間的技術(shù)關(guān)聯(lián),按照型號(hào)研制中設(shè)計(jì)、工藝、質(zhì)量、檢驗(yàn)、六性、管理部門(mén)普遍接受的要求,從總體論證的宏觀角度到信號(hào)處理的微觀角度進(jìn)行了充分的研究和實(shí)踐,對(duì)多個(gè)重點(diǎn)型號(hào)的成功經(jīng)驗(yàn)進(jìn)行總結(jié),創(chuàng)造性地形成了這一全軍普適的電子裝備質(zhì)量監(jiān)測(cè)、安全預(yù)警、智能診斷系統(tǒng)總體設(shè)計(jì)方案與實(shí)現(xiàn)方法。
目前我軍主戰(zhàn)裝備均采用三級(jí)維修體系(基層級(jí)、中繼級(jí)、基地級(jí)),其管理體制、維修方式主要參照機(jī)械化裝備維修保障特點(diǎn)規(guī)律構(gòu)建,已經(jīng)很難適應(yīng)未來(lái)信息化戰(zhàn)爭(zhēng)條件下部隊(duì)裝備維修的需求,存在著諸多不足,比如:
(1)層級(jí)偏多的維修作業(yè)體系難以適應(yīng)裝備高效化維修的要求,部分裝備上裝與平臺(tái)由于維修管理體制的不同,結(jié)構(gòu)特點(diǎn)和故障規(guī)律的差異,使得兩者沒(méi)有作為一個(gè)完整的系統(tǒng)實(shí)施全壽命、全系統(tǒng)維修。
(2)相對(duì)滯后的方法手段難以適應(yīng)裝備智能化維修的要求,社會(huì)面已經(jīng)成熟的資源可視化、虛擬維修、遠(yuǎn)程維修、交互式電子技術(shù)手段等技術(shù),促進(jìn)了傳統(tǒng)監(jiān)測(cè)與診斷技術(shù)進(jìn)步,推動(dòng)了維修決策支持系統(tǒng)的智能化發(fā)展,加速了維修信息系統(tǒng)與作戰(zhàn)指揮等系統(tǒng)的融合?,F(xiàn)有裝備維修仍以傳統(tǒng)的拆解、檢查、修復(fù)(換件)、組裝、試驗(yàn)為主,維修新技術(shù)、新方法并未充分發(fā)揮其作用。
美軍已經(jīng)實(shí)現(xiàn)了裝備保障的成功轉(zhuǎn)型,F(xiàn)-22 猛禽戰(zhàn)機(jī)在80 年代設(shè)計(jì)初期便采用先進(jìn)的兩級(jí)維修體制進(jìn)行了自主診斷和故障預(yù)警的功能設(shè)計(jì),使其在戰(zhàn)備完好性、戰(zhàn)場(chǎng)生存性、精準(zhǔn)維修、智能診斷、安全預(yù)警等多方面的能力大大提高,全壽命周期的費(fèi)用顯著降低,極大的推動(dòng)了三級(jí)維修體制向兩級(jí)的變革。
民用產(chǎn)品的保障也出現(xiàn)了很多創(chuàng)新且成功的做法,通過(guò)供應(yīng)鏈集成、大數(shù)據(jù)云平臺(tái)等手段,對(duì)保障進(jìn)行優(yōu)化,并將它變成一種戰(zhàn)略優(yōu)勢(shì),這對(duì)推行裝備智能化保障轉(zhuǎn)型是個(gè)很大的鼓舞。比如:奔馳已經(jīng)不再將備胎、千斤頂作為隨機(jī)備件,而是在出現(xiàn)問(wèn)題后,提供云平臺(tái)調(diào)配最近的4S 店提供備胎更換服務(wù)。這樣可以在滿足客戶需求的同時(shí),既表現(xiàn)出良好的反應(yīng)能力,也省去很大的成本。
美國(guó)國(guó)防部頒布的DoDD5000《國(guó)防采辦》指出“保障性和持續(xù)保障是武器系統(tǒng)性能的關(guān)鍵要素”。打仗就是打保障,為適應(yīng)新形勢(shì)下軍事戰(zhàn)爭(zhēng)對(duì)裝備智能化保障的要求,隨著裝備信息化的提升,創(chuàng)新維修技術(shù)的應(yīng)用,尤其是先進(jìn)智能診斷技術(shù)的快速發(fā)展,為了提高裝備完好性、提高保障效率、降低保障費(fèi)用。應(yīng)重點(diǎn)發(fā)展智能化檢測(cè)、監(jiān)測(cè)技術(shù),建立智能化、信息化的裝備質(zhì)量管理、維修保障體系,實(shí)時(shí)搜集和整理裝備技術(shù)性能和關(guān)鍵系統(tǒng)的狀態(tài)參數(shù),為故障預(yù)判、故障定位、快速維修提供依據(jù),并預(yù)測(cè)裝備故障和剩余壽命,從而提升任務(wù)成功率、裝備可用性和安全性、避免不必要的維修,從而適應(yīng)裝備精準(zhǔn)、智能、高效的維修保障要求。
裝備智能化保障要求在裝備研制初期就開(kāi)展兩級(jí)維修體系所必需的測(cè)試性設(shè)計(jì),以預(yù)置BIT(built in test,機(jī)內(nèi)測(cè)試)模塊的方式開(kāi)展自檢或狀態(tài)監(jiān)控,以預(yù)留可檢測(cè)點(diǎn)結(jié)合ATE 的方式開(kāi)展故障檢測(cè)或診斷,并綜合傳感采集、人工智能、嵌入式信號(hào)處理、網(wǎng)絡(luò)通信等技術(shù),對(duì)裝備狀態(tài)進(jìn)行實(shí)時(shí)或接近實(shí)時(shí)的健康評(píng)估,采取科學(xué)的維修措施,在出現(xiàn)早期故障征兆時(shí)進(jìn)行科學(xué)的維修,同時(shí)保證設(shè)備的安全性、可靠性。
因其在設(shè)計(jì)早期進(jìn)行了融合,從而可以實(shí)現(xiàn)全壽命周期的應(yīng)用,比如:
(1)研制階段可以應(yīng)用于裝備質(zhì)量檢測(cè)、監(jiān)測(cè),確保將合格的裝備交付部隊(duì)。
(2)按照裝備實(shí)戰(zhàn)化的考核要求,在試驗(yàn)鑒定階段可以實(shí)現(xiàn)狀態(tài)鑒定、作戰(zhàn)試驗(yàn)、列裝定型、在役考核、事故追溯等環(huán)節(jié)的質(zhì)量監(jiān)測(cè)和責(zé)任界定。
(3)服役階段可以實(shí)現(xiàn)安全預(yù)警、智能診斷功能。
(4)維修保障階段實(shí)現(xiàn)精準(zhǔn)維修、輔助決策功能。
(5)實(shí)現(xiàn)事前預(yù)防、事中考核、事后追溯的裝備全壽命周期合同質(zhì)量監(jiān)管。
(6)可以解決現(xiàn)行預(yù)防性維修的諸多弊端,如:費(fèi)用高、備件庫(kù)存多、過(guò)早拆卸部件、不能預(yù)先防止災(zāi)難性故障、不能記錄和再現(xiàn)NFF 故障等。
由于裝備智能化保障的諸多收益,美軍積極開(kāi)展了一系列的型號(hào)應(yīng)用,如:
①空軍開(kāi)展了預(yù)測(cè)與健康管理系統(tǒng)(JSF-PHM,Joint Strike Fighter-PHM);
②海軍開(kāi)展了綜合狀態(tài)評(píng)估系統(tǒng)(ICAS,Integrated Condition Assessment System);
③陸軍開(kāi)展了陸軍診斷改進(jìn)計(jì)劃(ADIP,Army Diagnostic Improvement Program)等。
開(kāi)展智能化保障的收益頗豐,以F-35 聯(lián)合戰(zhàn)機(jī)JSF-PHM 為例,其裝備保障規(guī)模減少了50%,出動(dòng)架次提高了25%,保障費(fèi)用減少了30%,維修人員減少了20%~40%。
美軍規(guī)劃和構(gòu)建裝備智能化保障是以測(cè)試性、故障診斷技術(shù)為基礎(chǔ),集故障檢測(cè)、狀態(tài)影響評(píng)價(jià)、故障處置、輔助引導(dǎo)、預(yù)測(cè)裝備運(yùn)行趨勢(shì)和使用壽命,為裝備使用和維修人員提供維修決策支持。
以美國(guó)NASA Diagnostics and Prognostics Group 開(kāi)展飛行器綜合健康管理的應(yīng)用為例,其將智能化保障的核心工作劃分為故障檢測(cè)、診斷、預(yù)測(cè)和輔助決策等進(jìn)行研究,其核心是:故障診斷技術(shù)、可靠性系統(tǒng)工程技術(shù)、容錯(cuò)控制技術(shù)。
(1)現(xiàn)有的故障診斷技術(shù)可大致分為基于模型的方法、基于數(shù)據(jù)的方法和基于知識(shí)的方法三類。表1 中對(duì)這三種故障診斷方法的優(yōu)缺點(diǎn)進(jìn)行了簡(jiǎn)單的總結(jié)。值得一提的是:這三種方法各有利弊,沒(méi)有一種方法可以解決所有問(wèn)題,不能一味求全,否則會(huì)導(dǎo)致無(wú)可用的方案。
表1 不同故障診斷方法的對(duì)比
目前國(guó)內(nèi)外對(duì)電子裝備故障檢測(cè)、診斷、預(yù)測(cè)技術(shù)的研究主要集中在對(duì)正常功能電學(xué)指標(biāo)(電壓、電流、頻率等)偏離的檢測(cè),最大的障礙是電子產(chǎn)品功能各異、構(gòu)成復(fù)雜、集成裝配后不易檢測(cè),另外電子產(chǎn)品故障具有不確定性、不穩(wěn)定性以及非線性等特征,且電子產(chǎn)品間歇性故障難以檢測(cè)。如果針對(duì)每一型電路板卡定制一個(gè)專用的故障檢測(cè)、預(yù)警電路,需要設(shè)計(jì)師增加大量的原理設(shè)計(jì)變更、Layout 布局變更、電路結(jié)構(gòu)變更、試驗(yàn)鑒定、聯(lián)調(diào)測(cè)試等工作,并且設(shè)計(jì)師普遍擔(dān)心附加的檢測(cè)電路的兼容性和可靠性會(huì)對(duì)其功能電路構(gòu)成影響、降低其功能系統(tǒng)的可靠性、增加了成本、增加了聯(lián)調(diào)測(cè)試風(fēng)險(xiǎn)、增加了排故困難、會(huì)嚴(yán)重拖長(zhǎng)研制周期,并影響自身的績(jī)效考核。因此目前尚無(wú)獲得廣泛認(rèn)可的成熟的電子產(chǎn)品智能診斷預(yù)警系統(tǒng)。
(2)2015 年國(guó)務(wù)院發(fā)布的《中國(guó)制造2025》明確指出:加強(qiáng)可靠性設(shè)計(jì)、試驗(yàn)、驗(yàn)證技術(shù)的研究與應(yīng)用。推廣先進(jìn)的在線故障預(yù)測(cè)與診斷技術(shù)及后勤系統(tǒng);國(guó)產(chǎn)關(guān)鍵產(chǎn)品可靠性指標(biāo)達(dá)到國(guó)際先進(jìn)水平。中國(guó)要從制造大國(guó)走向制造強(qiáng)國(guó),可靠性系統(tǒng)工程是唯一的可行之路。錢學(xué)森說(shuō)“可靠性是設(shè)計(jì)出來(lái)的、生產(chǎn)出來(lái)的、管理出來(lái)的”。裝備智能化保障最關(guān)心的故障檢測(cè)、監(jiān)測(cè)、預(yù)警與產(chǎn)品設(shè)計(jì)特性緊密相關(guān),主要包含六個(gè)方面:可靠性、維修性、測(cè)試性、保障性、環(huán)境適應(yīng)性和安全性。如圖1所示:
圖1 裝備質(zhì)量特性設(shè)計(jì)技術(shù)
可靠性系統(tǒng)工程是圍繞產(chǎn)品質(zhì)量保障規(guī)律組織管理的工作方法論,其指標(biāo)共有七個(gè)方面,分別是:長(zhǎng)壽命、高可靠、快診斷、能預(yù)測(cè)、易維修、好保障、要安全。這七個(gè)方面的要求在可靠性系統(tǒng)工程的技術(shù)體系里都有對(duì)應(yīng)的定量指標(biāo),如何做好這一工作,本質(zhì)上是故障和應(yīng)對(duì)故障的權(quán)衡,如圖2 所示:
圖2 可靠性系統(tǒng)工程中故障和故障應(yīng)對(duì)策略
這些工作看似分散,實(shí)則具有內(nèi)在的必然聯(lián)系,如果處理不好,就會(huì)出現(xiàn)工程中常說(shuō)的“兩張皮”現(xiàn)象。以FMEA(Failure Mode and Effect Analysis,失效模式和影響分析)為例,其主要目的是發(fā)現(xiàn)、評(píng)價(jià)產(chǎn)品/過(guò)程中潛在的失效及其后果;找到能夠避免或減少潛在失效發(fā)生的措施并且不斷地完善。能夠容易、低成本地對(duì)產(chǎn)品或過(guò)程進(jìn)行修改,從而減輕事后修改的危機(jī)。并找到能夠避免或減少這些潛在失效發(fā)生的措施。
然而很多企業(yè)實(shí)施過(guò)程中存在諸多誤區(qū),比如:
把FMEA 作為一份體系要求的文件來(lái)做,為了完成文件而做文件。通常在設(shè)計(jì)或者過(guò)程結(jié)束才開(kāi)始補(bǔ)文件,經(jīng)常會(huì)以客戶開(kāi)發(fā)時(shí)間節(jié)點(diǎn)太短為由,不愿花時(shí)間來(lái)分析風(fēng)險(xiǎn),問(wèn)題發(fā)生后來(lái)臨時(shí)補(bǔ)救,反而導(dǎo)致更多的投入。
①FMEA工作被安排成某個(gè)人的工作,而不是一個(gè)團(tuán)隊(duì)工作。研發(fā)部、制造部、生產(chǎn)部、質(zhì)量部和物流部等很少會(huì)在設(shè)計(jì)初期共同討論風(fēng)險(xiǎn)及其避免的方法。
②為應(yīng)付產(chǎn)品定型、軍方檢查、體系審核等需要,把FMEA 作為形式工作之一,或錯(cuò)誤地把FMEA 文件全部交給可靠性人員來(lái)做,設(shè)計(jì)工程師、工藝工程師沒(méi)有參與到潛在失效分析工作中。
③錯(cuò)誤的認(rèn)為FMEA 是解決問(wèn)題的工具,F(xiàn)MEA 是負(fù)責(zé)提出問(wèn)題、識(shí)別問(wèn)題的工具,真正的解決問(wèn)題需要專家團(tuán)隊(duì)做專題研究,從設(shè)計(jì)標(biāo)準(zhǔn)或者設(shè)計(jì)指導(dǎo)書(shū)來(lái)進(jìn)行檢測(cè)、預(yù)防。
④錯(cuò)誤的認(rèn)為FMEA 是不變的,F(xiàn)MEA 經(jīng)驗(yàn)積累的過(guò)程,是動(dòng)態(tài)文件。
⑤DFMEA(Design Failure Mode and Effects Analysis)忽視顧客的要求,沒(méi)有對(duì)用戶要求逐條分析,大多數(shù)PFMEA 不參考DFMEA。
(3)容錯(cuò)技術(shù)是提高系統(tǒng)可靠性的重要途徑。所謂容錯(cuò):就是容許錯(cuò)誤,是指設(shè)備的一個(gè)或多個(gè)關(guān)鍵部分發(fā)生故障時(shí),能夠自動(dòng)地進(jìn)行檢測(cè)與診斷,并采取相應(yīng)措施,保證設(shè)備維持其規(guī)定功能,或犧牲性能來(lái)保證設(shè)備在可接受范圍內(nèi)繼續(xù)工作。錯(cuò)誤一般分為兩類:第一類是先天性的固有錯(cuò)誤,如元器件生產(chǎn)過(guò)程中造成的錯(cuò)誤、線路與程序在設(shè)計(jì)過(guò)程中產(chǎn)生的錯(cuò)誤。這一類的錯(cuò)誤需對(duì)其拆除、更換或修正,是不能容忍的。第二類是后天性的錯(cuò)誤,它是由于設(shè)備在運(yùn)行中產(chǎn)生了缺陷所導(dǎo)致的故障。這種故障有瞬時(shí)性、間歇性和永久性的區(qū)別。
2021 年12 月24 日國(guó)家質(zhì)檢總局通告,華晨寶馬汽車有限公司召回生產(chǎn)日期從2021 年4 月30 日到2021 年8 月27 日的國(guó)產(chǎn)iX3 電動(dòng)汽車,共計(jì)1974 量。原因是“動(dòng)力電池內(nèi)部觸點(diǎn)系統(tǒng)插接口針腳處焊接質(zhì)量不良,可能導(dǎo)致溫度/電壓實(shí)際值和測(cè)量值出現(xiàn)偏差”,以圖3 為例:
圖3 電池分壓電壓偵測(cè)原理
以圖3 電池分壓電壓偵測(cè)原理為例,如果測(cè)量電池剩余電量的傳感器引腳虛焊,會(huì)產(chǎn)生額外的阻值,就會(huì)把3.7V 識(shí)別為3.5V,這個(gè)數(shù)值經(jīng)過(guò)ADC 芯片轉(zhuǎn)換,再傳給MCU 計(jì)算差的可不是0.2V(可能是電量驟降20%),剩余電量不足就會(huì)強(qiáng)制啟動(dòng)待機(jī)模式,中控屏幕就可能在明明有電的情況下出現(xiàn)黑屏。
本案例如果按照可靠性系統(tǒng)工程的思想,按照GJB1391《故障模式、影響及危害性分析程序》通過(guò)分析潛在的失效模式并根據(jù)其嚴(yán)重程度,發(fā)生幾率和發(fā)現(xiàn)的難易程度進(jìn)行優(yōu)先排序。就可以識(shí)別到MCU、R62、R26 為可能導(dǎo)致系統(tǒng)功能失常的關(guān)鍵件,且嚴(yán)酷度等級(jí)較高,發(fā)生頻率較高,采取容錯(cuò)設(shè)計(jì)、安全監(jiān)控手段,就可以得到有效的避免。由于缺少嚴(yán)謹(jǐn)?shù)目茖W(xué)工作態(tài)度導(dǎo)致了眾多慘痛事故,比如:
1998 年瑞士航空111 號(hào)班機(jī)發(fā)生空難,經(jīng)事故調(diào)查發(fā)現(xiàn)其中一根電線上有電弧,由此便推出了空難原因:由電線短路引起的火花點(diǎn)燃了聚對(duì)苯二甲酸乙二酯(PET)隔熱層,造成229 人遇難的慘痛事故。
2014 年亞洲航空8501 號(hào)班機(jī)發(fā)生空難,經(jīng)事故調(diào)查發(fā)現(xiàn)是由其方向舵限動(dòng)器的電路焊點(diǎn)存在虛焊,在過(guò)去一年內(nèi)出現(xiàn)了23 次重復(fù)的故障,卻沒(méi)有得到及時(shí)有效的根治,在當(dāng)晚的飛行中,故障反復(fù)出現(xiàn),導(dǎo)致了3 次警報(bào),第4 次警報(bào)時(shí)飛行員錯(cuò)誤造作最終導(dǎo)致飛機(jī)失速墜毀,造成162 人遇難的慘痛事故。
圖4 GE235班機(jī)事故調(diào)查報(bào)告pin34焊點(diǎn)的切片影像
2015 年臺(tái)灣復(fù)興航空235 號(hào)班機(jī)發(fā)生空難,事故調(diào)查員將飛行數(shù)據(jù)輸入模擬機(jī),并重建了事故過(guò)程。發(fā)現(xiàn)右側(cè)發(fā)動(dòng)機(jī)傳感器的電路板因?yàn)樘摵?,?dǎo)致系統(tǒng)誤判發(fā)動(dòng)機(jī)失效。緊接著飛行員錯(cuò)誤操作最終導(dǎo)致飛機(jī)墜毀,造成43 人遇難的慘痛事故。
2021 年陸軍裝備部發(fā)布的《關(guān)于加快推動(dòng)陸軍裝備高質(zhì)量高效益高速度低成本發(fā)展的倡議書(shū)》指出,探索推開(kāi)“研產(chǎn)供修管”一體化維修保障模式,實(shí)施維修保障經(jīng)費(fèi)定額撥付,倒逼設(shè)計(jì)、制造和生產(chǎn)環(huán)節(jié)就關(guān)注維修管理問(wèn)題,進(jìn)一步強(qiáng)化質(zhì)量意識(shí)、服務(wù)意識(shí)和成本控制意識(shí)。
當(dāng)前將質(zhì)量進(jìn)行體系化的建設(shè),融入到設(shè)計(jì)中,將質(zhì)量控制點(diǎn)前移至生產(chǎn)制造環(huán)節(jié),將智能制造在早期失效期獲得的數(shù)據(jù)轉(zhuǎn)變?yōu)槟P?,與設(shè)計(jì)進(jìn)行融合,就可以實(shí)現(xiàn)全壽命周期、全電系統(tǒng)的質(zhì)量提升和智能化提升。以問(wèn)題為導(dǎo)向,可以將軍方關(guān)心的重大故障、重復(fù)故障,在可靠性、測(cè)試性、維修性、保障性設(shè)計(jì)中進(jìn)行工程實(shí)現(xiàn),可以“故障”倒逼標(biāo)準(zhǔn)升級(jí)、倒逼產(chǎn)業(yè)升級(jí)、倒逼技術(shù)升級(jí),可以非常有力的支撐軍委提出的裝備實(shí)戰(zhàn)化的試驗(yàn)鑒定、在役考核的質(zhì)量管理,推動(dòng)裝備采購(gòu)合同監(jiān)督管理等工作,為我們從制造大國(guó)走向制造強(qiáng)國(guó)奠定堅(jiān)實(shí)的質(zhì)量基礎(chǔ)。