張士剛,羅 旭,駱彥廷,楊擁民
(國(guó)防科技大學(xué) 智能科學(xué)學(xué)院 裝備綜合保障技術(shù)重點(diǎn)實(shí)驗(yàn)室, 湖南 長(zhǎng)沙 410073)
當(dāng)前在工程中使用的故障診斷方法有基于數(shù)據(jù)驅(qū)動(dòng)的方式、基于模型的方式、數(shù)據(jù)和模型結(jié)合的方式等不同種類?;跀?shù)據(jù)驅(qū)動(dòng)的方式需要大量的實(shí)驗(yàn)或?qū)崪y(cè)數(shù)據(jù)進(jìn)行模型訓(xùn)練,這在新研制裝備或者無(wú)良好數(shù)據(jù)記錄的裝備上是不適用的?;谀P偷姆绞綄?duì)模型的精度有較高要求,其適用于工作原理清晰的裝備,缺點(diǎn)在于精確模型建立復(fù)雜。數(shù)據(jù)和模型結(jié)合的方式是當(dāng)前研究的熱點(diǎn)之一。達(dá)到這一目的的關(guān)鍵在于采用一種合理的模型,既能實(shí)現(xiàn)對(duì)先驗(yàn)知識(shí)的表達(dá)又能較好地將數(shù)據(jù)融入模型中。
概率圖模型是大的知識(shí)表達(dá)模型。貝葉斯網(wǎng)作為其中的模型之一,由于具有明確的物理意義,在故障診斷領(lǐng)域已得到了較好的應(yīng)用[1-3],并且表現(xiàn)出良好的發(fā)展和改進(jìn)前景。按照概率圖理論研究專家美國(guó)斯坦福大學(xué)Koller教授的說(shuō)法,概率圖是少數(shù)同時(shí)集表達(dá)、推理、學(xué)習(xí)三種能力于一體的框架模型之一[4]。該模型相關(guān)的特性和故障診斷所面臨的問題有諸多共通之處,受到了國(guó)內(nèi)外學(xué)者的普遍關(guān)注。Pattipati教授所帶領(lǐng)的團(tuán)隊(duì)以概率圖理論為基礎(chǔ)提出了動(dòng)態(tài)多故障診斷(Dynamic Multiple Fault Diagnosis, DMFD)模型[5-6]、因子隱馬爾科夫模型[7](Factorial Hidden Markov Model, FHMM)、耦合因子隱馬爾科夫模型[8-9](Coupled FHMM, CFHMM)等多種動(dòng)態(tài)故障診斷模型,有效解決了動(dòng)態(tài)故障診斷、不確定性條件下的多故障診斷等問題;Li等研究了動(dòng)態(tài)貝葉斯網(wǎng)在飛機(jī)機(jī)翼健康監(jiān)控?cái)?shù)字孿生中的應(yīng)用[10];Cai等研究了貝葉斯網(wǎng)在瞬時(shí)和間歇故障診斷中的應(yīng)用,對(duì)模型的構(gòu)建和應(yīng)用方法進(jìn)行了闡述[11-12];于寄語(yǔ)研究了貝葉斯網(wǎng)在機(jī)械故障檢測(cè)中的應(yīng)用[13]。除了模型的應(yīng)用方法,在模型構(gòu)建方面,當(dāng)前也有不少學(xué)者進(jìn)行了理論和方法研究工作,比如Campos等研究了基于信息熵簡(jiǎn)化搜索空間的貝葉斯網(wǎng)構(gòu)建方法[14];Andrews等研究了混合變量情況下的貝葉斯網(wǎng)評(píng)分方法[15];Scutari等對(duì)三種不同類型的貝葉斯網(wǎng)模型學(xué)習(xí)方法進(jìn)行了對(duì)比研究,包括基于約束的方法、基于評(píng)分的方法和二者結(jié)合的混合算法[16]。
總的來(lái)看,國(guó)內(nèi)外學(xué)者在概率圖理論方法或者概率圖在故障診斷的應(yīng)用方面均有不少研究工作,但大部分的研究是針對(duì)應(yīng)用、學(xué)習(xí)或者推理的某一方面,而未對(duì)模型構(gòu)建、不同場(chǎng)景下的診斷應(yīng)用、預(yù)測(cè)方法、學(xué)習(xí)進(jìn)化等方面進(jìn)行統(tǒng)一的闡述。本文在系統(tǒng)梳理總結(jié)已有研究成果的基礎(chǔ)上,研究了多模式系統(tǒng)的診斷模型構(gòu)建方法,形成了基于概率圖的故障診斷模型及學(xué)習(xí)進(jìn)化統(tǒng)一理論框架。系統(tǒng)闡述了該模型在故障診斷領(lǐng)域的應(yīng)用場(chǎng)景,包括模型構(gòu)建、多模式情形下的模型、動(dòng)態(tài)故障診斷模型、診斷模型學(xué)習(xí)進(jìn)化方法等內(nèi)容,并指出了在該理論框架下下一步可進(jìn)行深入研究的方向。研究過程中涉及的主要模型及其特點(diǎn)如表1所示,其中序號(hào)7-11所示的模型為下一步可深入研究的模型。
表1 研究涉及的模型及主要特點(diǎn)Tab.1 Characteristics of the models discussed in this research
貝葉斯網(wǎng)是一種基于網(wǎng)絡(luò)結(jié)構(gòu)的有向圖解表示,是基于概率分析、圖論的一種不確定性知識(shí)表達(dá)和推理模型,是一種將因果知識(shí)和概率知識(shí)結(jié)合的信息表示框架。具體來(lái)講,貝葉斯網(wǎng)是由節(jié)點(diǎn)以及連接節(jié)點(diǎn)之間的有向邊及其中的概率參數(shù)組成的。在故障診斷中,主要考量的是故障模式和測(cè)試之間的關(guān)系。與之相對(duì)應(yīng),診斷貝葉斯網(wǎng)所包含的元素也主要由這些變量組成。其中,測(cè)試量和故障模式分別映射為變量,它們之間的影響關(guān)系映射為有向邊。如圖1所示,為某發(fā)動(dòng)機(jī)診斷貝葉斯網(wǎng)的部分結(jié)構(gòu),其中包含了噴油器霧化不良、噴油器阻塞兩種底層故障模式,這兩種故障模式發(fā)生時(shí)均可導(dǎo)致燃燒不良,所反映出來(lái)的征兆包括缸內(nèi)爆壓偏低、功率降低、油耗偏高等可測(cè)特征。
圖1 診斷貝葉斯網(wǎng)示例Fig.1 Example of diagnostic Bayesian networks
變量節(jié)點(diǎn)由不同的狀態(tài)組成,節(jié)點(diǎn)之間通過相關(guān)性概率表(條件概率表)表示相關(guān)性強(qiáng)度。如表2所示,為節(jié)點(diǎn)“燃燒不良”所對(duì)應(yīng)的概率表。依據(jù)表中的內(nèi)容,若噴油器霧化不良未發(fā)生、噴油器阻塞發(fā)生時(shí),燃燒不良的概率為0.7。其他狀態(tài)組合時(shí)的參數(shù)具有類似的含義。
表2“燃燒不良”節(jié)點(diǎn)條件概率表
Tab.2 Conditional probability distribution table of the poor combustion node
噴油器霧化不良未發(fā)生發(fā)生噴油器阻塞未發(fā)生發(fā)生未發(fā)生發(fā)生燃燒不良(未發(fā)生)0.980.30.150.08燃燒不良(發(fā)生)0.020.70.850.92
實(shí)現(xiàn)基于貝葉斯網(wǎng)診斷的關(guān)鍵在于針對(duì)具體裝備構(gòu)建出類似圖1所示的貝葉斯網(wǎng),并且基于實(shí)測(cè)數(shù)據(jù)進(jìn)行推理計(jì)算。診斷的過程為給出故障征兆或者測(cè)試數(shù)據(jù)推理得出診斷結(jié)論的過程。在實(shí)施過程中,首先將測(cè)試量或已知征兆按照實(shí)測(cè)值設(shè)為證據(jù)變量,然后進(jìn)行推理計(jì)算,可得出其他變量不同狀態(tài)的發(fā)生概率。依據(jù)故障變量的概率,可判斷是否有故障發(fā)生。以圖1所示的貝葉斯網(wǎng)為例,假設(shè)系統(tǒng)有功率降低和油耗偏高兩種征兆,經(jīng)過推理后,得出的故障發(fā)生概率分別為:燃燒不良0.995,噴油器霧化不良0.708,噴油器阻塞0.648??梢耘袛嗖裼蜋C(jī)系統(tǒng)發(fā)生了燃燒不良的問題,故障原因可能是噴油器霧化不良和阻塞,霧化不良的概率高于阻塞。
在一般情況下,貝葉斯網(wǎng)的構(gòu)造方法有兩種:一種是通過咨詢專家手工構(gòu)造,另一種是通過數(shù)據(jù)分析,利用機(jī)器學(xué)習(xí)的方法來(lái)獲得貝葉斯網(wǎng)。但是經(jīng)過總結(jié)可以發(fā)現(xiàn),無(wú)論哪種方法,要么需要大量的實(shí)際測(cè)試數(shù)據(jù),要么需要進(jìn)行大量的分析設(shè)計(jì)工作,工作十分復(fù)雜。在實(shí)際工作中,尤其對(duì)于一種新裝備來(lái)說(shuō),往往無(wú)法提供大量的故障數(shù)據(jù)供貝葉斯網(wǎng)的學(xué)習(xí)使用,嚴(yán)重限制了這種方法的應(yīng)用。
在現(xiàn)代裝備設(shè)計(jì)過程中,除了功能要求以外,對(duì)裝備的測(cè)試性、維修性、可靠性等通用質(zhì)量特性普遍提出了要求。測(cè)試性建模是其中的關(guān)鍵工作內(nèi)容之一。為此,可采用基于測(cè)試性模型的貝葉斯網(wǎng)自動(dòng)構(gòu)建方法來(lái)簡(jiǎn)化貝葉斯網(wǎng)的構(gòu)建過程[17]。從測(cè)試性分析與設(shè)計(jì)的角度來(lái)看,在測(cè)試性建模過程中已經(jīng)對(duì)系統(tǒng)的結(jié)構(gòu)、故障模式及測(cè)試之間的關(guān)系進(jìn)行了大量分析工作。充分利用這些先期工作,減少重復(fù)勞動(dòng)并提供一種通用的自動(dòng)構(gòu)建診斷貝葉斯網(wǎng)的方法是一件十分有意義的事情。具體實(shí)現(xiàn)方案如圖2所示,其中接口文件和所構(gòu)建的貝葉斯網(wǎng)為示意圖。接口文件主要是相關(guān)性矩陣,表示的是故障(f1~f4)和測(cè)試(t1~t4)之間的相關(guān)性。具體而言,元素1表示對(duì)應(yīng)列的測(cè)試可以檢測(cè)到對(duì)應(yīng)行的故障,元素0表示不可檢測(cè)。貝葉斯網(wǎng)構(gòu)建的主要思想是實(shí)現(xiàn)測(cè)試和故障及其相關(guān)性關(guān)系到節(jié)點(diǎn)及有向邊的映射[17]。當(dāng)前該方案已經(jīng)在發(fā)動(dòng)機(jī)、裝甲車輛、航天產(chǎn)品等裝備上進(jìn)行了初步應(yīng)用。實(shí)施過程中,首先采用TEAMS軟件構(gòu)建系統(tǒng)的測(cè)試性模型(即多信號(hào)流圖模型),對(duì)系統(tǒng)進(jìn)行測(cè)試性分析,進(jìn)行傳感器優(yōu)化設(shè)計(jì)[18];然后,生成以相關(guān)性矩陣為主的接口文件;在此基礎(chǔ)上,依據(jù)因果關(guān)系的一致性,構(gòu)建診斷貝葉斯網(wǎng)模型,用于診斷和推理。
圖2 診斷貝葉斯網(wǎng)構(gòu)建方法示意Fig.2 Example of diagnostic Bayesian networks constructing method
普通的貝葉斯網(wǎng)是一種靜態(tài)結(jié)構(gòu),無(wú)法有效表達(dá)故障的演化信息。而實(shí)際上,當(dāng)前的故障狀態(tài)和上一時(shí)刻的故障狀態(tài)密切相關(guān),故障也可能會(huì)存在傳播和時(shí)延的問題。針對(duì)這一復(fù)雜故障情形,需要更為強(qiáng)大的模型。因此,基于貝葉斯網(wǎng)和馬爾科夫相關(guān)理論,研究提出了一種動(dòng)態(tài)故障診斷推理模型[19],故障演化、耦合關(guān)系等動(dòng)態(tài)參數(shù)可得到有效表達(dá),如圖3所示。
圖3 動(dòng)態(tài)故障診斷模型Fig.3 Dynamic fault diagnosis model
在該模型中,不同的故障模式通過單個(gè)馬爾科夫鏈進(jìn)行表征。每一個(gè)圓圈表示故障狀態(tài),方塊表示測(cè)試值。模型中的有向邊表示故障和故障之間或者故障和測(cè)試之間的相關(guān)性關(guān)系。在實(shí)際系統(tǒng)中,不同故障之間的關(guān)聯(lián)關(guān)系表示故障耦合,故障和測(cè)試之間的關(guān)系表示測(cè)試關(guān)系。這些關(guān)系的發(fā)生可能存在時(shí)間延遲,表示故障傳播時(shí)間和測(cè)試時(shí)延。
該模型將故障的動(dòng)態(tài)特性引入診斷推理過程中,可適用于復(fù)雜非線性系統(tǒng)的診斷。同時(shí),由于模型可表達(dá)故障之間的關(guān)聯(lián)關(guān)系,該模型具有一定的耦合故障診斷能力。和常規(guī)的故障診斷不同,基于該模型的故障診斷需要考慮測(cè)試的時(shí)序問題。推理過程中,可選擇時(shí)間窗迭代計(jì)算的方法,即選取一段時(shí)間的測(cè)試結(jié)果,進(jìn)行推理計(jì)算,得到該窗口內(nèi)的故障狀態(tài)。隨著新的測(cè)試結(jié)果的加入,逐步移動(dòng)診斷窗口,更新診斷結(jié)論?;谠撍枷?,前期研究中提出了部分采樣算法和分塊坐標(biāo)上升-維特比算法[19],可用于工程中的診斷推理。
針對(duì)大部分系統(tǒng)而言,其工作狀態(tài)不可能一成不變,并且不同工況之間還可能存在過渡狀態(tài)。在不同運(yùn)行工況下,故障的特征可能不盡相同,測(cè)試正常與否的判決方式也不盡相同。這類變工況系統(tǒng)的故障診斷也稱為多模式系統(tǒng)故障診斷。針對(duì)這一問題可采用下述兩種方案進(jìn)行建模。
普通的貝葉斯網(wǎng)一旦結(jié)構(gòu)確定就不會(huì)再發(fā)生變化,這不適用于變工況系統(tǒng)的故障診斷。變結(jié)構(gòu)貝葉斯網(wǎng)的提出為解決這一問題提供了一種新的思路。變結(jié)構(gòu)的含義為依據(jù)診斷網(wǎng)絡(luò)中某些變量取值的不同,有些邊的相關(guān)性會(huì)發(fā)生改變。其中最典型的是環(huán)境獨(dú)立貝葉斯網(wǎng)[20-21],如圖4所示。其中c表示環(huán)境控制變量,f3到t4之間邊上的參數(shù)表示只有當(dāng)c=1時(shí)該相關(guān)性關(guān)系才會(huì)存在。如果c表示某一工況參數(shù),則表示只有在工況代碼為1時(shí)f3和t4之間才有相關(guān)性關(guān)系,這和多工況故障診斷過程及需求具有一致的含義。
圖4 環(huán)境獨(dú)立貝葉斯網(wǎng)Fig.4 Context-specific independence Bayesian networks
為了更加直觀地表達(dá)變結(jié)構(gòu)信息和實(shí)現(xiàn)貝葉斯網(wǎng)的構(gòu)建,在此可將工況變化信息抽象為一個(gè)節(jié)點(diǎn),通過參數(shù)的相關(guān)性設(shè)置實(shí)現(xiàn)變結(jié)構(gòu)的表達(dá)。和第2節(jié)所示的單模式下的貝葉斯網(wǎng)構(gòu)建方法不同,在這種變結(jié)構(gòu)情況下,貝葉斯網(wǎng)的構(gòu)建和參數(shù)設(shè)置方式如下所述。
1)對(duì)系統(tǒng)相關(guān)性進(jìn)行分析和表征:建立系統(tǒng)的多模式測(cè)試性模型,對(duì)系統(tǒng)進(jìn)行分析,得到一組共兩個(gè)相關(guān)性矩陣。假設(shè)系統(tǒng)共有m個(gè)故障模式,n個(gè)測(cè)試,k個(gè)開關(guān)。第一個(gè)矩陣表達(dá)故障和測(cè)試之間的相關(guān)性關(guān)系,即D1=[dij]m×n,其中dij∈{0,1},取值為0表示第j個(gè)測(cè)試在任意模式下均無(wú)法檢測(cè)到第i個(gè)故障;取值為1表示第j個(gè)測(cè)試可以檢測(cè)到第i個(gè)故障。第二個(gè)矩陣表達(dá)的是開關(guān)和測(cè)試的相關(guān)性,用D2=[rij]n×k表示,其中rij∈{0,1},取值為0表示第j個(gè)測(cè)試和故障的相關(guān)性不受第i個(gè)開關(guān)狀態(tài)的影響;取值為1表示第j個(gè)測(cè)試和故障的相關(guān)性和第i個(gè)開關(guān)的狀態(tài)相關(guān)。
2)確定多工況系統(tǒng)貝葉斯網(wǎng)的結(jié)構(gòu):依據(jù)貝葉斯網(wǎng)的定義,貝葉斯網(wǎng)的結(jié)構(gòu)包括節(jié)點(diǎn)以及節(jié)點(diǎn)之間的連接關(guān)系兩部分。在變結(jié)構(gòu)系統(tǒng)中,貝葉斯網(wǎng)由兩層共三類節(jié)點(diǎn)組成。第一層為故障和開關(guān)層,分別用故障節(jié)點(diǎn)和開關(guān)節(jié)點(diǎn)表示。第二層為測(cè)試層,用測(cè)試節(jié)點(diǎn)表示。故障節(jié)點(diǎn)和故障模式相對(duì)應(yīng),共有m個(gè)。開關(guān)節(jié)點(diǎn)和開關(guān)相對(duì)應(yīng),共有k個(gè)。測(cè)試節(jié)點(diǎn)和測(cè)試相對(duì)應(yīng),共有n個(gè)。
在確定好節(jié)點(diǎn)數(shù)目和類型后,為節(jié)點(diǎn)之間添加連接關(guān)系。添加的方式依據(jù)兩個(gè)相關(guān)性矩陣進(jìn)行,具體為:針對(duì)矩陣D1=[dij]m×n,如果dij=1,則在第i個(gè)故障(用fi表示)和第j個(gè)測(cè)試(用tj表示)之間添加連接關(guān)系,方向由fi指向ti;針對(duì)矩陣D2=[rij]n×k,如果rij=1,則在第j個(gè)測(cè)試(用tj表示)和第i個(gè)開關(guān)(用si表示)之間添加連接關(guān)系,方向由si指向tj。
3)確定變結(jié)構(gòu)系統(tǒng)貝葉斯網(wǎng)的參數(shù)并采用樹形結(jié)構(gòu)進(jìn)行表征:針對(duì)故障節(jié)點(diǎn),設(shè)置正常和異常兩種狀態(tài),異常概率表示故障率。針對(duì)開關(guān)節(jié)點(diǎn),設(shè)置開和關(guān)兩種狀態(tài),概率分別設(shè)為0.5。針對(duì)某一個(gè)測(cè)試節(jié)點(diǎn),用集合E={F,S}表示初始備選節(jié)點(diǎn)集,其中F表示與其相關(guān)的故障節(jié)點(diǎn),S表示與其相關(guān)的開關(guān)節(jié)點(diǎn)。從集合E中選擇相關(guān)故障節(jié)點(diǎn)數(shù)目最多且不為0的開關(guān)節(jié)點(diǎn)作為下一步的樹節(jié)點(diǎn)。針對(duì)開關(guān)閉合分枝,從E中去除該開關(guān)節(jié)點(diǎn);針對(duì)開關(guān)斷開這一分枝,從E中去除該開關(guān)節(jié)點(diǎn)以及和該開關(guān)相關(guān)的故障節(jié)點(diǎn),更新E。若無(wú)開關(guān)節(jié)點(diǎn),選擇故障率最高的故障節(jié)點(diǎn)作為下一步的樹節(jié)點(diǎn),從E中去除該故障節(jié)點(diǎn),更新E。針對(duì)故障存在這一分枝,存儲(chǔ)參數(shù)1,停止擴(kuò)展該分枝;針對(duì)故障不存在這一分枝,若E中不包含其他故障節(jié)點(diǎn),存儲(chǔ)參數(shù)0,否則,繼續(xù)選擇節(jié)點(diǎn),擴(kuò)展參數(shù)表達(dá)樹,直至達(dá)到停止條件。最終所得的二叉樹即為測(cè)試節(jié)點(diǎn)的參數(shù)。
以某系統(tǒng)為例,假設(shè)m=3,n=2,k=2。如圖5所示,f1~f3為三個(gè)故障節(jié)點(diǎn),t1~t2為兩個(gè)測(cè)試節(jié)點(diǎn),當(dāng)s2閉合時(shí),f3和t1相關(guān),否則不相關(guān)。
圖5 變結(jié)構(gòu)系統(tǒng)Fig.5 Multimode system
則可得到兩個(gè)矩陣分別為:
(1)
(2)
所得到的變結(jié)構(gòu)貝葉斯網(wǎng)如圖6所示。節(jié)點(diǎn)t1的參數(shù)設(shè)置如圖7所示。
圖6 變結(jié)構(gòu)系統(tǒng)貝葉斯網(wǎng)Fig.6 Bayesian networks of the multimode system
圖7 t1節(jié)點(diǎn)的參數(shù)設(shè)置Fig.7 Parameters of node t1
除了t1以外,其他的參數(shù)設(shè)置方式和傳統(tǒng)的貝葉斯網(wǎng)一致,比如,針對(duì)故障節(jié)點(diǎn)(即f1, f2, f3),每一節(jié)點(diǎn)均有兩種狀態(tài):正常和異常。異常的概率即故障率,假定三個(gè)故障率分別為0.1、0.3和0.6。針對(duì)開關(guān)節(jié)點(diǎn)(即s1,s2),每一節(jié)點(diǎn)有兩種狀態(tài):開和關(guān)。兩者的發(fā)生概率均設(shè)為0.5。
為了證明方法的有效性,在此采用貝葉斯網(wǎng)建模和推理工具GeNIe進(jìn)行仿真分析[22]。假定每個(gè)故障模式均有兩個(gè)狀態(tài)——good和bad,測(cè)試有pass和fail兩個(gè)狀態(tài),分別表示測(cè)試正常和異常。仿真過程中假設(shè)測(cè)試t1異常,t2正常,當(dāng)s1打開、s2閉合時(shí),診斷結(jié)果如圖8所示。此時(shí),f2沒有被任何測(cè)試檢測(cè),故其故障概率為原始故障率0.3。以此為基礎(chǔ)進(jìn)行推理,f1可確定為異常,f3可被t2完全排除。
當(dāng)s1和 s2均閉合時(shí),結(jié)果如圖9所示。此時(shí)t1可檢測(cè)到f1、f2和f3。f3可被t2完全排除,f1、f2的經(jīng)推理后的故障率分別為0.27和0.81,均比原始概率有所提升,符合實(shí)際情況。
圖8 s1打開、s2閉合時(shí)診斷結(jié)果Fig.8 Diagnostic result that s1 is open and s2 is closed
圖9 s1、s2均閉合時(shí)診斷結(jié)果Fig.9 Diagnostic result that both s1 and s2 are closed
如果實(shí)際系統(tǒng)中的故障情形比較復(fù)雜,故障具有動(dòng)態(tài)特性,則多模式系統(tǒng)故障診斷可用變結(jié)構(gòu)動(dòng)態(tài)模型進(jìn)行建模[23],如圖10所示。
圖10 變結(jié)構(gòu)動(dòng)態(tài)診斷模型Fig.10 Multimode dynamic fault diagnosis model
該模型主要由兩部分組成:第一部分為若干個(gè)第3節(jié)所述的動(dòng)態(tài)診斷模型,分別代表不同工況下的診斷網(wǎng)絡(luò),它們的相關(guān)性參數(shù)以及故障集合可能不同;第二部分為控制網(wǎng)絡(luò),可以認(rèn)為是一個(gè)馬爾科夫模型,用來(lái)確定系統(tǒng)的工況或模式。實(shí)際診斷推理過程中,首先基于部分測(cè)試信息進(jìn)行推理,依據(jù)控制網(wǎng)絡(luò)確定系統(tǒng)當(dāng)前的狀態(tài),對(duì)系統(tǒng)工況進(jìn)行判定。然后依據(jù)確定的工況自動(dòng)選用合適的動(dòng)態(tài)診斷推理模型,進(jìn)行參數(shù)調(diào)控,獲取推理模型,并進(jìn)行推理計(jì)算,得到系統(tǒng)當(dāng)前的故障狀況。不同工況下的模型可以通過過渡狀態(tài)進(jìn)行連接。在過渡狀態(tài),模型參數(shù)依據(jù)控制網(wǎng)絡(luò)狀態(tài)變量的取值進(jìn)行合理設(shè)置。
隨著狀態(tài)監(jiān)控理念的進(jìn)步,故障不只是要求能進(jìn)行診斷,而且要求能盡可能地提前預(yù)知,即故障預(yù)測(cè)。在前文闡述的動(dòng)態(tài)診斷模型中,雖考慮了時(shí)間要素,但測(cè)試只和等于或比它時(shí)刻早的故障相關(guān),即只考慮了時(shí)延現(xiàn)象。事實(shí)上,故障預(yù)測(cè)和時(shí)延在時(shí)間參數(shù)上是相反的關(guān)系,通過對(duì)模型進(jìn)行改進(jìn),測(cè)試可以和以后時(shí)刻的故障狀態(tài)相關(guān),則可以實(shí)現(xiàn)對(duì)故障預(yù)測(cè)信息的表征,達(dá)到利用統(tǒng)一模型實(shí)現(xiàn)故障診斷和預(yù)測(cè)一體化的目的。如圖11所示[24],原有的診斷推理算法經(jīng)過時(shí)間變換即可用于故障預(yù)測(cè)推理[25]。
圖11 含故障預(yù)測(cè)的動(dòng)態(tài)診斷模型Fig.11 Dynamic fault diagnosis model considering fault prediction
基于該模型,針對(duì)某航天器電源系統(tǒng)進(jìn)行了仿真計(jì)算,某次計(jì)算結(jié)果如圖12所示[25]。
圖12 故障預(yù)測(cè)案例結(jié)果Fig.12 Result of a fault prognosis case
在圖12中,橫坐標(biāo)表示時(shí)刻點(diǎn),縱坐標(biāo)表示故障索引。仿真過程中,首先注入某個(gè)故障模式,生成測(cè)試數(shù)據(jù);然后,利用該測(cè)試數(shù)據(jù)和診斷模型按時(shí)刻順序依次進(jìn)行診斷推理,比較推理結(jié)果和實(shí)際注入的故障,如果二者一致表示診斷結(jié)果正確,如果可以對(duì)未來(lái)的故障狀態(tài)進(jìn)行提前輸出,證明模型具有一定的故障預(yù)測(cè)能力。在圖12中,“*” 表示在驗(yàn)證過程中注入的故障模式,方框表示采用診斷模型的診斷推理結(jié)果。圖中所展示的是診斷推理到30時(shí)刻時(shí)(即圖中所示豎線表征的時(shí)刻)的診斷狀態(tài)。由圖示結(jié)果可以看出,診斷模型不僅給出了30時(shí)刻以前的狀態(tài),而且還給出了未來(lái)兩個(gè)時(shí)刻的狀態(tài),并且和實(shí)際注入的故障一致,表明了診斷模型具有一定的故障預(yù)測(cè)能力。需要說(shuō)明的是,達(dá)到這一目的前提是所構(gòu)建的模型具有和實(shí)際系統(tǒng)相符的合理結(jié)構(gòu)和參數(shù)。
貝葉斯網(wǎng)等概率圖故障診斷模型的構(gòu)建依賴于先驗(yàn)知識(shí)。然而,當(dāng)前裝備的相關(guān)知識(shí)是在設(shè)計(jì)階段就設(shè)計(jì)確定的。由于系統(tǒng)設(shè)計(jì)時(shí)運(yùn)維知識(shí)有限,對(duì)運(yùn)行環(huán)境的認(rèn)識(shí)不夠,或者針對(duì)新研制裝備本身就缺乏相應(yīng)的故障知識(shí)積累,在診斷策略使用過程中經(jīng)常存在“水土不服”的現(xiàn)象。尤其是新研制的裝備,診斷系統(tǒng)虛警率高、維修策略不符合實(shí)際等問題反映強(qiáng)烈,影響了裝備的可用性。為此需要研究一種既能利用設(shè)計(jì)時(shí)的先驗(yàn)知識(shí)又能隨著使用數(shù)據(jù)積累進(jìn)行能力增強(qiáng)的機(jī)制,為實(shí)現(xiàn)智能自適應(yīng)診斷提供一條新的解決途徑。在此可采用一種通過參數(shù)學(xué)習(xí)和結(jié)構(gòu)學(xué)習(xí)改進(jìn)診斷策略的方法。其基礎(chǔ)模型為前文所討論的貝葉斯網(wǎng)等診斷模型,參數(shù)學(xué)習(xí)采用最大似然估計(jì)的方式,結(jié)構(gòu)學(xué)習(xí)采用改進(jìn)的評(píng)分-搜索策略,基本思想如圖13所示。
圖13 利用結(jié)構(gòu)學(xué)習(xí)方法改進(jìn)診斷模型的流程Fig.13 Procedure of fault diagnosis model improvement using structure learning
為了驗(yàn)證方法的有效性,采用仿真的方法進(jìn)行了驗(yàn)證。仿真策略為:首先隨機(jī)生成診斷模型,然后基于該模型生成一組采樣數(shù)據(jù)。將模型隨機(jī)刪除部分邊,然后再采用學(xué)習(xí)算法進(jìn)行學(xué)習(xí)改進(jìn),得到學(xué)習(xí)后的模型?;谠寄P?、刪除邊后的模型、學(xué)習(xí)后的模型采用相同數(shù)據(jù)進(jìn)行模擬診斷推理,進(jìn)行結(jié)果對(duì)比并判斷學(xué)習(xí)效果。某系統(tǒng)的仿真結(jié)果如表3所示。其中正確檢測(cè)率指的是故障狀態(tài)被正確檢測(cè)出的比例,錯(cuò)誤檢測(cè)率指的是正常狀態(tài)被錯(cuò)誤地隔離成故障的比例??梢钥闯觯蛣h除邊后的模型對(duì)比,參數(shù)學(xué)習(xí)后和結(jié)構(gòu)學(xué)習(xí)后的模型診斷結(jié)果均有提升,接近或好于原始模型,從而證明了方法的有效性。更為深入和詳細(xì)的闡述可參考文獻(xiàn)[26]中的研究。
表3 學(xué)習(xí)結(jié)果對(duì)比Tab.3 Comparison of the learning result
1)隱變量與未知故障:在貝葉斯網(wǎng)構(gòu)建過程中,故障模式可能考慮得不夠完善,即變量集合不夠全面。在使用過程中,可能會(huì)存在數(shù)據(jù)和模型不符的現(xiàn)象。通過貝葉斯網(wǎng)隱藏變量的學(xué)習(xí),有可能發(fā)現(xiàn)未知故障,提高對(duì)系統(tǒng)故障模式的認(rèn)識(shí)水平并為改進(jìn)診斷策略提供支撐。
2)局部診斷模型優(yōu)化:復(fù)雜結(jié)構(gòu)的貝葉斯網(wǎng)運(yùn)算量較大,使用過程可能存在推理時(shí)間過長(zhǎng)的問題。實(shí)際工程中,可依據(jù)實(shí)際狀況研究模型局部?jī)?yōu)化措施,比如因果獨(dú)立假設(shè)等,增強(qiáng)實(shí)用性。
3)復(fù)雜變量情形下的推理:在診斷系統(tǒng)中,測(cè)試量有連續(xù)量也有離散量。當(dāng)前常用的診斷貝葉斯網(wǎng)以離散量為主,如何實(shí)現(xiàn)混合變量情形下的建模和診斷推理是需要研究的問題之一。另外,可能還存在部分變量可觀測(cè)的情形,如何進(jìn)行學(xué)習(xí)改進(jìn)和優(yōu)化是需要研究的內(nèi)容。
4)分層及分布式故障診斷:復(fù)雜系統(tǒng)往往由很多部件組成,并且具有復(fù)雜的層級(jí)結(jié)構(gòu)。實(shí)際診斷過程中,診斷層級(jí)不一定到故障模式,到可更換單元即可滿足要求。另外,由于系統(tǒng)單元模塊多,采用單個(gè)模型復(fù)雜度很高,在診斷效率上無(wú)法滿足應(yīng)用要求。如何針對(duì)復(fù)雜系統(tǒng)實(shí)現(xiàn)分層診斷和分布式診斷是非常有意義的研究?jī)?nèi)容之一。
1)對(duì)基于概率圖的診斷推理模型進(jìn)行了闡述,提出了基于統(tǒng)一理論框架的故障診斷模型這一理念,研究了針對(duì)多種應(yīng)用場(chǎng)景的故障診斷整體技術(shù)方案。
2)研究了統(tǒng)一理論框架下的貝葉斯網(wǎng)構(gòu)建、動(dòng)態(tài)故障診斷、多模式故障診斷、預(yù)測(cè)和診斷一體化推理、診斷模型學(xué)習(xí)改進(jìn)方法等內(nèi)容,對(duì)各模型之間的關(guān)系進(jìn)行了闡述,給出了部分模型的仿真結(jié)果,驗(yàn)證了方法的有效性。
3)對(duì)模型的進(jìn)一步發(fā)展進(jìn)行了展望。
國(guó)防科技大學(xué)學(xué)報(bào)2020年2期