翟嘉琪,楊希祥,程玉強(qiáng),李 亮
(國(guó)防科技大學(xué) 空天科學(xué)學(xué)院,長(zhǎng)沙 410005)
隨著科技的發(fā)展和制造工藝的進(jìn)步,設(shè)備或系統(tǒng)的復(fù)雜度不斷增加,在使用過(guò)程中的任何異常或故障不僅直接影響產(chǎn)品的使用,而且還可能造成嚴(yán)重的安全事故。經(jīng)過(guò)長(zhǎng)期的實(shí)踐和經(jīng)驗(yàn),要使設(shè)備或系統(tǒng)能夠安全、可靠、有效地運(yùn)行,必須要對(duì)其進(jìn)行故障檢測(cè)與診斷。實(shí)踐證明,堅(jiān)持開(kāi)展設(shè)備狀態(tài)監(jiān)測(cè),有效地實(shí)施故障檢測(cè)與診斷技術(shù)可以早期發(fā)現(xiàn)故障,避免重大安全事故的發(fā)生,保障設(shè)備系統(tǒng)正常運(yùn)行。
1967年,美國(guó)國(guó)家宇航局(NASA)就開(kāi)始關(guān)注故障診斷相關(guān)研究,創(chuàng)立了MFPG(美國(guó)機(jī)械故障預(yù)防小組),標(biāo)志著故障診斷技術(shù)的誕生,隨后歐洲的發(fā)達(dá)國(guó)家和日本也開(kāi)展了故障檢測(cè)與診斷技術(shù)的研究。隨著故障檢測(cè)與診斷技術(shù)所產(chǎn)生經(jīng)濟(jì)效益和安全價(jià)值不斷增加,越來(lái)越多的研究人員投入其中,并得以迅速發(fā)展。目前已成功應(yīng)用于航天、軍事、核能、電力、化工、冶金等行業(yè)。
故障檢測(cè)與診斷的終極目標(biāo)是盡可能迅速準(zhǔn)確地檢測(cè)出故障,并及時(shí)對(duì)檢測(cè)出的故障做出判斷,最后依據(jù)診斷結(jié)果采取相應(yīng)的措施,一般評(píng)價(jià)指標(biāo)有以下幾個(gè)部分:1)實(shí)時(shí)性:在發(fā)生故障時(shí),應(yīng)迅速對(duì)故障的發(fā)生進(jìn)行檢測(cè)和判斷;2)故障的誤報(bào)率、漏報(bào)率和錯(cuò)報(bào)率:誤報(bào)指的是未發(fā)生故障卻報(bào)出故障;漏報(bào)指的是發(fā)生故障卻未報(bào)出故障;錯(cuò)報(bào)發(fā)生故障,但報(bào)出的故障信息與實(shí)際故障不一致;3)靈敏度和魯棒性,靈敏度指的是對(duì)故障信號(hào)感應(yīng)的靈敏程度,魯棒性是指在干擾、噪聲、建模等誤差情況下穩(wěn)定完成故障診斷任務(wù)的能力;4)故障定位能力:是指故障診斷系統(tǒng)區(qū)分不同故障的能力;5)準(zhǔn)確性:對(duì)故障大小進(jìn)行正確判斷的程度。
早期的故障檢測(cè)與診斷主要依賴于專家或技術(shù)人員的決策,然而專業(yè)人員容易受到壓力、疲勞、心理因素、自身知識(shí)水平、技能等影響,做出與實(shí)際狀態(tài)相差較大的分析,從而產(chǎn)生錯(cuò)誤的判斷。隨著傳感器、無(wú)線通信、移動(dòng)終端、計(jì)算機(jī)等的發(fā)展,基于模型的故障診斷方法最先發(fā)展起來(lái),這種方法需要針對(duì)待測(cè)對(duì)象建立精確的數(shù)學(xué)模型,需要完整認(rèn)識(shí)待測(cè)對(duì)象的深層知識(shí),不依賴于歷史數(shù)據(jù)或已知的故障數(shù)據(jù),因此可以診斷出未知的故障。隨著技術(shù)的不斷進(jìn)步,待測(cè)對(duì)象不斷復(fù)雜化、大型化、非線性化、系統(tǒng)化,建立精確的數(shù)學(xué)模型難度越來(lái)越大,各設(shè)備之間存在的耦合,使得模型難度也會(huì)成指數(shù)增加?;谛盘?hào)處理的方法不需要精確的數(shù)學(xué)模型,回避了基于模型的故障診斷方法的難點(diǎn),而是基于待測(cè)對(duì)象的信號(hào)模型,分析測(cè)得的信號(hào)數(shù)據(jù)提取特征信號(hào)值,根據(jù)特征值是否異常來(lái)判斷待測(cè)對(duì)象是否發(fā)生故障,該方法基本不依賴于待測(cè)對(duì)象的模型,既適用于線性系統(tǒng)又可適用非線性系統(tǒng),但是它只是對(duì)待測(cè)對(duì)象的信號(hào)數(shù)據(jù)進(jìn)行分析,對(duì)系統(tǒng)高維信號(hào)之間的耦合性和關(guān)聯(lián)度挖掘不夠,沒(méi)有更加深入地利用待測(cè)對(duì)象的深層信息。
隨著傳感器技術(shù)、計(jì)算機(jī)技術(shù)、工藝技術(shù)和網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,人類對(duì)知識(shí)的認(rèn)識(shí)、管理和應(yīng)用水平的提高,使得設(shè)備或系統(tǒng)數(shù)據(jù)的獲取、存儲(chǔ)、傳輸、加工、分析和利用得到了有效提升,其中機(jī)器學(xué)習(xí)具有快速處理大量數(shù)據(jù)、分析提取有效信息等優(yōu)點(diǎn),已被越來(lái)越多地應(yīng)用于故障檢測(cè)與診斷技術(shù)(fault detection and diagnosis,F(xiàn)DD)中來(lái)[1]。
鑒于機(jī)器學(xué)習(xí)技術(shù)的發(fā)展日新月異,國(guó)內(nèi)基于機(jī)器學(xué)習(xí)應(yīng)用于故障檢測(cè)與診斷技術(shù)的相關(guān)研究仍處于起步階段,缺乏對(duì)基于機(jī)器學(xué)習(xí)的故障檢測(cè)與診斷方法的系統(tǒng)介紹,與當(dāng)前基于深度學(xué)習(xí)或某一確定方法的故障診斷綜述性文章相比,本文系統(tǒng)地從機(jī)器學(xué)習(xí)在故障檢測(cè)與診斷領(lǐng)域的應(yīng)用中的基本概念、國(guó)內(nèi)外現(xiàn)狀、算法模型分類比較、關(guān)鍵技術(shù)及未來(lái)發(fā)展等若干層次對(duì)當(dāng)前的相關(guān)研究進(jìn)行說(shuō)明,為進(jìn)一步深入研究和拓展故障檢測(cè)和診斷的機(jī)器學(xué)習(xí)算法模型奠定了基礎(chǔ)。
機(jī)器學(xué)習(xí)是一門(mén)多領(lǐng)域交叉學(xué)科,涉及計(jì)算機(jī)科學(xué)(人工智能、理論計(jì)算機(jī)科學(xué))、數(shù)學(xué)(概率和數(shù)理統(tǒng)計(jì)、信息科學(xué)、控制理論)、心理學(xué)(人類問(wèn)題求解和記憶模型)、生物學(xué)/遺傳學(xué)(遺傳算法、神經(jīng)網(wǎng)絡(luò)),專門(mén)研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自己的性能,圖一是機(jī)器學(xué)習(xí)的簡(jiǎn)單模型。環(huán)境提供外界信息,類似教師的角色;學(xué)習(xí)環(huán)節(jié)處理環(huán)境提供的信息,相當(dāng)于各種學(xué)習(xí)算法,以便改善知識(shí)庫(kù)中的知識(shí);知識(shí)庫(kù)以某種知識(shí)表示存儲(chǔ)信息;執(zhí)行環(huán)節(jié)利用知識(shí)庫(kù)中的知識(shí)來(lái)完成某種任務(wù),并把執(zhí)行情況回送至學(xué)習(xí)環(huán)節(jié)。從數(shù)學(xué)的角度上看,機(jī)器學(xué)習(xí)是對(duì)于輸入X,嘗試尋找能輸出預(yù)期y的f函數(shù)。機(jī)器學(xué)習(xí)問(wèn)題也可以理解為求最優(yōu)解,在求解最優(yōu)參數(shù)時(shí),往往沒(méi)有閉式解即明確答案,因此我們需要比較各種機(jī)器學(xué)習(xí)模型在同一個(gè)問(wèn)題上的優(yōu)劣性,最終得到最合適的模型[2]。
圖1 機(jī)器學(xué)習(xí)模型
基于學(xué)習(xí)形式的不同,通常可將機(jī)器學(xué)習(xí)算法分為有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)以及強(qiáng)化學(xué)習(xí)三類:
1)有監(jiān)督學(xué)習(xí)(Supervised Learning):用已知某種或某些特性的樣本作為訓(xùn)練集,以建立一個(gè)數(shù)學(xué)模型,再用已建立的模型來(lái)預(yù)測(cè)并輸出未知樣本。當(dāng)輸出為離散的,學(xué)習(xí)任務(wù)為分類任務(wù);當(dāng)輸出為連續(xù)的,學(xué)習(xí)任務(wù)為回歸任務(wù)。監(jiān)督學(xué)習(xí)主要被用于解決分類和回歸的問(wèn)題。常見(jiàn)的算法有:決策樹(shù)、人工神經(jīng)網(wǎng)絡(luò)算法、支持向量機(jī)、樸素貝葉斯、K近鄰、邏輯回歸、隨機(jī)森林。
2)無(wú)監(jiān)督學(xué)習(xí)(Unsupervised Learning):沒(méi)有對(duì)訓(xùn)練樣本的信息進(jìn)行標(biāo)記,其目標(biāo)是通過(guò)對(duì)無(wú)標(biāo)記樣本的學(xué)習(xí)來(lái)發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的聯(lián)系和規(guī)律,為后續(xù)的數(shù)據(jù)分析進(jìn)一步提供依據(jù)。無(wú)監(jiān)督學(xué)習(xí)便于壓縮數(shù)據(jù)存儲(chǔ)、減少計(jì)算量、提升算法速度,還可以避免正負(fù)樣本偏移引起的分類錯(cuò)誤問(wèn)題,主要用于經(jīng)濟(jì)預(yù)測(cè)、異常檢測(cè)、數(shù)據(jù)挖掘、圖像處理、模式識(shí)別等領(lǐng)域,常見(jiàn)的算法有:聚類算法、降維算法,主成分分析。
3)強(qiáng)化學(xué)習(xí)(Reinforcement Learning):該算法描述的是一個(gè)與環(huán)境交互的學(xué)習(xí)過(guò)程,把環(huán)境的反饋?zhàn)鳛檩斎耄ㄟ^(guò)學(xué)習(xí)則能達(dá)到其目標(biāo)的最優(yōu)動(dòng)作。強(qiáng)化學(xué)習(xí)的組成部分:reward(獎(jiǎng)勵(lì))、agent(智能體)、environment(環(huán)境)、state(狀態(tài))、action(行為),強(qiáng)化學(xué)習(xí)的目的為選擇action用以最大化所有未來(lái)的reward的總和。常見(jiàn)的算法有:TD(λ)算法、Q-learning算法,Sarsa算法。
隨著生產(chǎn)制造技術(shù)的快速發(fā)展,許多設(shè)備和系統(tǒng)的結(jié)構(gòu)已變得越來(lái)越復(fù)雜,由于各種復(fù)雜性和運(yùn)行因素(自身磨損、外部環(huán)境)的影響,設(shè)備的性能和系統(tǒng)的狀態(tài)會(huì)隨著使用時(shí)間增加而逐漸退化,若不及時(shí)進(jìn)行狀態(tài)監(jiān)測(cè)和故障診斷,必將發(fā)生故障,而一旦出現(xiàn)故障,最終可能會(huì)導(dǎo)致嚴(yán)重的安全事故。為提高設(shè)備或系統(tǒng)的安全性和可靠性,故障檢測(cè)與診斷技術(shù)(fault detection and diagnosis,F(xiàn)DD)應(yīng)運(yùn)而生。故障檢測(cè)與診斷技術(shù)包括故障檢測(cè)、故障分離和故障識(shí)別、故障決策,能夠判斷設(shè)備或系統(tǒng)狀態(tài)是否正常、故障發(fā)生的時(shí)間和位置,確定故障的類型,并在分離出故障后確定故障大小和特性,給出發(fā)生故障后的解決措施。
故障檢測(cè)主要判斷設(shè)備或系統(tǒng)是否發(fā)生了故障和指明發(fā)生故障的時(shí)間。故障檢測(cè)主要起監(jiān)控作用,當(dāng)故障發(fā)生時(shí),系統(tǒng)或設(shè)備的輸出參數(shù)便會(huì)偏離正常的目標(biāo)參數(shù),甚至超出給定的閾值范圍。故障檢測(cè)技術(shù)利用這些提取到的故障數(shù)據(jù)或者處理后的故障數(shù)據(jù)進(jìn)行故障檢測(cè),這些故障數(shù)據(jù)信息包含過(guò)程故障或系統(tǒng)故障的特征,所以可以用來(lái)檢測(cè)系統(tǒng)的運(yùn)行過(guò)程是否發(fā)生故障,然后根據(jù)故障發(fā)生情況確定故障發(fā)生的時(shí)間。清華大學(xué)教授周東華從故障診斷的角度分析,提出了定性分析方法和定量分析方法,前者分為圖論方法、專家系統(tǒng)方法以及定性仿真,后者可分為基于解析模型的方法和基于數(shù)據(jù)驅(qū)動(dòng)的方法[3]如圖2。
圖2 故障檢測(cè)分類
故障診斷是指當(dāng)設(shè)備或系統(tǒng)出現(xiàn)故障時(shí),依據(jù)其實(shí)際的狀態(tài)及表征參數(shù)的變化判斷是否發(fā)生故障,若發(fā)生故障,就確定故障的位置、大小、時(shí)刻、原因等信息。故障診斷的最終目標(biāo)是盡可能迅速地、準(zhǔn)確地去檢測(cè)出故障,并對(duì)該故障作出分離和判斷,最終依據(jù)診斷結(jié)果給出需要采取的相應(yīng)措施[4]。
根據(jù)采用的特征描述和決策方法的差異,故障診斷方法可以劃分成基于知識(shí)的方法、基于解析模型的方法、基于信號(hào)處理的方法3種[5],如圖3。
圖3 故障診斷分類
機(jī)器學(xué)習(xí)的目標(biāo)是通過(guò)某種機(jī)器學(xué)習(xí)算法得到輸入輸出間的關(guān)系,并能夠利用這種關(guān)系對(duì)給定的輸入盡可能準(zhǔn)確的給出系統(tǒng)未知的輸出。而故障檢測(cè)與診斷的目標(biāo)就是利用測(cè)試數(shù)據(jù)(傳感器、文字、語(yǔ)音、視頻等)來(lái)尋求測(cè)試數(shù)據(jù)和故障之間的聯(lián)系,因此可以認(rèn)為故障檢測(cè)與診斷本質(zhì)上也是一個(gè)機(jī)器學(xué)習(xí)問(wèn)題。隨著技術(shù)的不斷進(jìn)步,當(dāng)前工業(yè)過(guò)程可以獲得大量的狀態(tài)數(shù)據(jù),而機(jī)器學(xué)習(xí)正好能通過(guò)算法模型對(duì)這些數(shù)據(jù)進(jìn)行處理,從而實(shí)時(shí)檢測(cè)整個(gè)過(guò)程中設(shè)備或系統(tǒng)的故障狀態(tài),并能夠基于數(shù)據(jù)對(duì)設(shè)備或系統(tǒng)進(jìn)行故障診斷。故障檢測(cè)是故障診斷的前提,前者用來(lái)確定系統(tǒng)是否發(fā)生了故障以及發(fā)生故障的時(shí)間,而后者是在檢測(cè)出故障之后,確定故障的類型或者位置。機(jī)器學(xué)習(xí)在故障檢測(cè)領(lǐng)域的應(yīng)用主要包括主元分析(PCA)、隨機(jī)森林等。
在實(shí)際故障檢測(cè)中,通常會(huì)選擇能夠反映研究對(duì)象的變量來(lái)進(jìn)行觀測(cè),而在系統(tǒng)結(jié)構(gòu)日益復(fù)雜變量信息過(guò)多時(shí),會(huì)增加研究對(duì)象的復(fù)雜性。
PCA是將獲得的待測(cè)對(duì)象到的高維歷史數(shù)據(jù)組成一個(gè)矩陣,進(jìn)行一系列矩陣運(yùn)算后確定若干正交向量(向量個(gè)數(shù)遠(yuǎn)小于維數(shù)),歷史數(shù)據(jù)在這些正交向量上的投影反映數(shù)據(jù)變化最大的幾個(gè)方向,舍去數(shù)據(jù)變化較小的方向,由此可將高維數(shù)據(jù)降維表示。主元分析用于故障檢測(cè)的主要思想是把在正常過(guò)程中獲得的數(shù)據(jù),最大限度地保持原有信息不受損失,將這些數(shù)據(jù)高度相關(guān)的過(guò)程變量投影到低維空間中,獲得能夠表述系統(tǒng)內(nèi)部關(guān)系的幾個(gè)主要成分,即主元模型。即把多個(gè)不同的相關(guān)量換成少量幾個(gè)獨(dú)立的變量,并對(duì)這幾個(gè)獨(dú)立變量進(jìn)行統(tǒng)計(jì)檢驗(yàn)分析,進(jìn)而判斷系統(tǒng)是否偏離正常工況[6]。用這些數(shù)據(jù)來(lái)判定實(shí)際研究對(duì)象中T2統(tǒng)計(jì)量、殘差空間的SPE統(tǒng)計(jì)量等是否超過(guò)已設(shè)定的過(guò)程監(jiān)控指標(biāo),從而判斷系統(tǒng)是否發(fā)生故障。
PCA已經(jīng)成功應(yīng)用于化工過(guò)程、半導(dǎo)體過(guò)程、機(jī)械過(guò)程、廢水處理、核工業(yè)過(guò)程、空氣檢測(cè)處理等[7];余莎莎等提出了基于PCA模型的故障檢測(cè)方法,根據(jù)平方預(yù)測(cè)誤差和其閾值大小的比較,利用該方法已成功建立了空調(diào)系統(tǒng)故障檢測(cè)模型,用來(lái)判斷系統(tǒng)是否發(fā)生故障[8];周福娜等基于PCA的故障檢測(cè)方法通過(guò)分析檢測(cè)數(shù)據(jù)和主元模型之間的差異來(lái)判斷系統(tǒng)是否出現(xiàn)故障[9]。
PCA對(duì)數(shù)據(jù)降維處理有著絕佳的優(yōu)勢(shì),但是仍存在兩個(gè)問(wèn)題:1)線性分解方法壓縮和提取不充分;2)線性方法的結(jié)果不可靠,在較小的主元中可能含有重要的非線性信息,導(dǎo)致重要信息的丟失,因此可以結(jié)合其他方法進(jìn)行優(yōu)化。為了克服傳統(tǒng)主元分析因模式復(fù)合現(xiàn)象而無(wú)法進(jìn)行多故障診斷和診斷結(jié)果難以解釋的不足,周福娜等提出了指定元分析(DCA)的方法,建立了多故障診斷理論的空間投影框架,這種方法可以將檢測(cè)出的異常轉(zhuǎn)化為觀測(cè)數(shù)據(jù)在故障子空間上的投影能量的顯著性檢測(cè)問(wèn)題,這種方法能夠有效解決指定模式非正交情況下的多故障診斷問(wèn)題[10];梁艷等針對(duì)實(shí)際化工過(guò)程會(huì)受到不同程度非高斯擾動(dòng)影響的問(wèn)題,提出一種基于廣義互熵主元分析的故障檢測(cè)方法,并將其應(yīng)用于天納森-伊斯曼過(guò)程進(jìn)行故障檢測(cè),與傳統(tǒng)PCA方法對(duì)比后,該方法在處理非高斯的故障檢測(cè)方面表現(xiàn)出良好的性能,有較低的誤報(bào)率和漏報(bào)率[11];Lv等提出使用聚類原則對(duì)研究對(duì)象劃分成子空間,使用貝葉斯方法融合子空間的信息進(jìn)行決策,在青霉素發(fā)酵過(guò)程中驗(yàn)證該方法,并與多向主元分析(MPCA)進(jìn)行對(duì)比,有效提高故障檢測(cè)正確率[12]。
美國(guó)科學(xué)院院士 Breiman等人在2001年提出隨機(jī)森林算法[13],這種算法將集成了分類與回歸決策樹(shù)(classification and regression tree,CART)。隨機(jī)森林是Bagging的一個(gè)擴(kuò)展變體,而B(niǎo)agging是并行式集成學(xué)習(xí)方法最著名的代表,給定包含m個(gè)樣本的數(shù)據(jù)集,隨機(jī)取一個(gè)樣本放入采樣集中,再將其放入初始數(shù)據(jù)集,使得下次采樣仍能被選中,經(jīng)m次取樣后得到m個(gè)采樣集,初始訓(xùn)練集中有的在采樣集中多次出現(xiàn),有的從未出現(xiàn),采樣出T個(gè)含m個(gè)訓(xùn)練樣本的采樣集,基于每個(gè)采樣集訓(xùn)練一個(gè)基學(xué)習(xí)器,再結(jié)合這些基學(xué)習(xí)器,使用簡(jiǎn)單投票法對(duì)分類任務(wù)進(jìn)行預(yù)測(cè)輸出,使用簡(jiǎn)單平均法對(duì)回歸任務(wù)進(jìn)行預(yù)測(cè)輸出。隨機(jī)森林以決策樹(shù)為基學(xué)習(xí)器構(gòu)建Bagging集成,傳統(tǒng)決策樹(shù)在選擇劃分屬性是在當(dāng)前節(jié)點(diǎn)的屬性集合(d個(gè))中選擇一個(gè)最優(yōu)屬性;在RF中,先從決策樹(shù)中的每個(gè)節(jié)點(diǎn)的屬性集合中隨機(jī)選擇一個(gè)包含k個(gè)屬性的子集,再?gòu)淖蛹羞x擇一個(gè)最優(yōu)屬性用于劃分,其中k控制了隨機(jī)性的 引入程度。隨機(jī)森林由于其算法簡(jiǎn)單、容易實(shí)現(xiàn)、計(jì)算量小、處理高維度數(shù)據(jù)以及分類速度快等特點(diǎn),被用于故障檢測(cè)中。
Iftikhar Ahmad等提出了一種基于數(shù)據(jù)的電力電纜系統(tǒng)的故障診斷系統(tǒng),利用小波分析和倒譜分析得到特征變量,比較了k-近鄰、k-NN,ANN、隨機(jī)森林、分類回歸樹(shù)(CART)以及增強(qiáng)型CART等6種方法[14];Sanghyuk Lee利用相似性度量和隨機(jī)森林算法對(duì)航空系統(tǒng)進(jìn)行故障檢測(cè),使用距離信息設(shè)計(jì)了相似性度量,通過(guò)隨機(jī)森林算法技進(jìn)行相似性度量權(quán)重計(jì)算,并提供數(shù)據(jù)優(yōu)先級(jí),[15];Jong Oh 等使用隨機(jī)森林分析了神經(jīng)元數(shù)據(jù)集,并衡量了數(shù)據(jù)中每個(gè)輸入變量之間的相對(duì)重要性,可以極大地減少變量的數(shù)量,保留原始數(shù)據(jù)的可識(shí)別性[16];Quiroz J C提出一種基于隨機(jī)森林算法的LS-PMSM(直線啟動(dòng)永磁同步電機(jī))故障檢測(cè)方法,基于隨機(jī)森林算法得到電機(jī)的特征數(shù)據(jù)的特征重要性排序,使得輸入模型的特征數(shù)量降低,并將其與決策樹(shù)、樸素貝葉斯分類器、邏輯回歸、以及支持向量機(jī)等進(jìn)行比較,隨機(jī)森林的進(jìn)度更高,可將該方法應(yīng)用于工業(yè)生產(chǎn)過(guò)程的狀態(tài)監(jiān)測(cè)[17]。
隨機(jī)森林方法可以對(duì)故障進(jìn)行有效的檢測(cè),但是沒(méi)有考慮到數(shù)據(jù)之間的自相關(guān)和互相關(guān)關(guān)系,大量的耦合特性會(huì)影響隨機(jī)森林模型的精確度,同時(shí),由于隨機(jī)森林方法至少需要兩類數(shù)據(jù)進(jìn)行訓(xùn)練,現(xiàn)有單類隨機(jī)森林方法采用原始投票多數(shù)方法檢測(cè)故障,沒(méi)有構(gòu)建相應(yīng)的統(tǒng)計(jì)量,因此當(dāng)數(shù)據(jù)量有限,且變量之間存在耦合時(shí),單類隨機(jī)森林方法無(wú)法很好實(shí)現(xiàn)及時(shí)、有效的故障檢測(cè),因此需要對(duì)隨機(jī)森林算法進(jìn)行改進(jìn)和優(yōu)化。Mariela Cerrada提出基于遺傳算法的特征獲取與隨機(jī)森林模型相結(jié)合的齒輪故障檢測(cè)方法,利用遺傳算法從振動(dòng)信號(hào)中提取時(shí)間、頻率和時(shí)域的特征子集,將其應(yīng)用于隨機(jī)森林的訓(xùn)練,直到隨機(jī)森林模型的性能達(dá)到最佳[18];針對(duì)單棵決策樹(shù)模型分類方法精度不高,容易出現(xiàn)過(guò)擬合等問(wèn)題,郝姜偉等提出使用組合單決策樹(shù)來(lái)提高計(jì)算精度的隨機(jī)森林算法,并將其應(yīng)用于飛機(jī)發(fā)動(dòng)機(jī)故障檢測(cè)中[19];曹玉蘋(píng)等提出一種新的基于動(dòng)態(tài)單類隨機(jī)森林的故障檢測(cè)方法,這種方法針對(duì)高維化工過(guò)程中存在的非線性和動(dòng)態(tài)特性,根據(jù)正常狀態(tài)下的過(guò)程數(shù)據(jù)的反分布產(chǎn)生離群點(diǎn)數(shù)據(jù),同時(shí)利用典型變量分析方法對(duì)正常數(shù)據(jù)進(jìn)行相關(guān)性分析,利用典型變量空間數(shù)據(jù)(正常數(shù)據(jù)和離群點(diǎn)數(shù)據(jù)在典型變量空間的投影)訓(xùn)練隨機(jī)森林[20];陳宇韜等提出一種基于極端森林的故障檢測(cè)方法,該方法利用pearson相關(guān)性分析去掉線性相關(guān)性較弱和非主要特征的變量,使得樣本維度降低,利用最大信息系數(shù)獲得主要特征參數(shù)的相關(guān)系數(shù),消除冗余變量提高故障檢測(cè)精度,已成功應(yīng)用于大型風(fēng)電機(jī)組發(fā)電機(jī)的故障檢測(cè),結(jié)構(gòu)說(shuō)明該方法具有更低的漏報(bào)率、誤報(bào)率和更好的實(shí)時(shí)性[21]。
故障診斷技術(shù)發(fā)展至今,已經(jīng)提出了較多的方法,從開(kāi)始的基于解析模型方法到現(xiàn)在的基于機(jī)器學(xué)習(xí)方法,在不需要太多的先驗(yàn)知識(shí)以及系統(tǒng)精確解析模型的情況下完成系統(tǒng)的故障診斷,機(jī)器學(xué)習(xí)擁有很廣泛的應(yīng)用空間,其在故障診斷領(lǐng)域的應(yīng)用主要包括決策樹(shù)、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等。
決策樹(shù)是一種基本的分類與回歸方法,一般的,一顆決策樹(shù)包含根節(jié)點(diǎn)(一個(gè))、內(nèi)部節(jié)點(diǎn)(n個(gè))和葉節(jié)點(diǎn)(m個(gè)),葉節(jié)點(diǎn)對(duì)應(yīng)于事件的決策結(jié)果(m個(gè)),內(nèi)部節(jié)點(diǎn)對(duì)應(yīng)于一個(gè)屬性測(cè)試(n個(gè));根節(jié)點(diǎn)包含的樣本全集根據(jù)屬性測(cè)試的結(jié)果被劃分到節(jié)點(diǎn)中,從根節(jié)點(diǎn)至每個(gè)葉結(jié)點(diǎn)的路徑對(duì)應(yīng)了一個(gè)判定測(cè)試序列。決策樹(shù)的構(gòu)造是一個(gè)遞歸的過(guò)程,有3種情形會(huì)導(dǎo)致遞歸返回:(1)當(dāng)前結(jié)點(diǎn)包含的樣本全屬于同一類別,這時(shí)直接將該節(jié)點(diǎn)標(biāo)記為葉節(jié)點(diǎn),并設(shè)為相應(yīng)的類別(無(wú)需劃分);(2)當(dāng)前屬性集為空,或是所有樣本在所有屬性上取值相同,這時(shí)將該節(jié)點(diǎn)標(biāo)記為葉節(jié)點(diǎn),并將其類別設(shè)為該節(jié)點(diǎn)所含樣本最多的類別(無(wú)法劃分);(3)當(dāng)前結(jié)點(diǎn)包含的樣本集合為空,這時(shí)也將該節(jié)點(diǎn)標(biāo)記為葉節(jié)點(diǎn),并將其類別設(shè)為父節(jié)點(diǎn)中所含樣本最多的類(不能劃分)。
圖4 決策樹(shù)結(jié)構(gòu)
決策樹(shù)可以進(jìn)行自學(xué),不需要任何專家知識(shí),可以根據(jù)設(shè)備自行生成決策系統(tǒng)。決策樹(shù)算法是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)算法,以表達(dá)的知識(shí)簡(jiǎn)單直觀、高推理效率、易于提取顯示規(guī)則、計(jì)算量相對(duì)較小、可以顯示重要決策屬性和較高的分類準(zhǔn)確率等優(yōu)點(diǎn)而得到廣泛的應(yīng)用。董明提出了一種利用屬于模式識(shí)別范疇的決策樹(shù)C4.5法進(jìn)行油浸式電力變壓器故障診斷的方法,實(shí)現(xiàn)了變壓器故障由粗到細(xì)的逐級(jí)劃分,有利于提高診斷的準(zhǔn)確性[22];Wang D提出了基于集成決策樹(shù)電網(wǎng)故障診斷方法,使用屬性選擇機(jī)制將大量的電力信號(hào)屬性組成子集,每個(gè)子集都是經(jīng)過(guò)訓(xùn)練的單獨(dú)決策樹(shù),和多個(gè)決策樹(shù)模型一起投票 進(jìn)行電網(wǎng)故障診斷,結(jié)果很好地表明該方法有較高的穩(wěn)定性和準(zhǔn)確性[23];王小樂(lè)等提出了一種基于決策樹(shù)的在軌衛(wèi)星故障診斷知識(shí)挖掘方法,能夠提高知識(shí)的準(zhǔn)確率同時(shí)降低誤警率[24];Huang等針對(duì)燃料電池發(fā)動(dòng)機(jī)的故障診斷,提出一種結(jié)合了C4.5決策樹(shù)和故障診斷專家系統(tǒng)的診斷方法,原始數(shù)據(jù)在經(jīng)過(guò)數(shù)據(jù)預(yù)處理和特征選擇后,導(dǎo)入訓(xùn)練集,將規(guī)則存儲(chǔ)在知識(shí)庫(kù),對(duì)故障進(jìn)行分類,實(shí)現(xiàn)燃料電池的故障診斷[25];Feng等提出一種基于決策樹(shù)的變壓器絕緣故障診斷新的方法,不僅具有快速的歸納學(xué)習(xí)能力和分類速度,而且能有效壓縮數(shù)據(jù)和內(nèi)存[26]。
決策樹(shù)算法在信息增益進(jìn)行選擇時(shí),可能出現(xiàn)的偏向問(wèn)題,會(huì)對(duì)取值較多的屬性有所偏向,在某些特殊的情況下,通過(guò)其確定出的信息使用價(jià)值并不高,因此可以與其他算法結(jié)合,實(shí)現(xiàn)更好的故障診斷。劉偉等提出一種基于決策樹(shù)與模糊推理脈沖神經(jīng)網(wǎng)絡(luò)的輸出電網(wǎng)故障診斷方法,結(jié)果表明該方法在單類型和多類型故障信息丟失時(shí),依然能夠正確診斷出故障元件[27];王同輝等針對(duì)某型號(hào)的變流器在工作過(guò)程中出現(xiàn)逆變過(guò)流故障的原因進(jìn)行分析,提出了一種基于EOVW指數(shù)和決策樹(shù)相結(jié)合的系統(tǒng)診斷方案,利用小波分析算法提取變流器的輸出電壓、電流等信號(hào)特征,基于決策樹(shù)的數(shù)據(jù)挖掘思維和分類功能,實(shí)現(xiàn)了對(duì)變流器逆變過(guò)流故障的識(shí)別和有效定位[28];Sumana De等基于案例推理方法設(shè)計(jì),采用決策樹(shù)和雅克卡相似度方法,決策樹(shù)用于將案例存儲(chǔ)到案例庫(kù)庫(kù)中,Jaccard相似度算法計(jì)算新案例和存儲(chǔ)案例之間的相似度,將案例聚類成決策樹(shù),有利于與提高汽車(chē)故障診斷效率[29]。
支持向量機(jī)(Support Vector Machine)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的有監(jiān)督學(xué)習(xí)方法,在1995年由前蘇聯(lián)教授Cortes和 Vapnik提出,由于在分類任務(wù)中的卓越性能,很快成為機(jī)器學(xué)習(xí)的主流技術(shù)。與傳統(tǒng)學(xué)習(xí)方法不同,支持向量機(jī)通過(guò)尋求最小結(jié)構(gòu)化風(fēng)險(xiǎn)來(lái)提高學(xué)習(xí)機(jī)的泛化能力,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的最小化,在統(tǒng)計(jì)樣本量較小的情況下,達(dá)到良好統(tǒng)計(jì)規(guī)律目的,主要用于分類和回歸問(wèn)題。例如,訓(xùn)練樣本中有兩類標(biāo)識(shí)過(guò)的樣本點(diǎn),根據(jù)支持向量機(jī)算法建立訓(xùn)練模型,模型可以將實(shí)心點(diǎn)和空心點(diǎn)代表兩類樣本,H代表最優(yōu)分類線,H1和H2與H平行,且同時(shí)經(jīng)過(guò)距離最優(yōu)分類線最近的點(diǎn),分類間隔指的是H1和H2之間的距離。對(duì)于高維數(shù)據(jù)集(N),則需要N-1維的對(duì)象對(duì)數(shù)據(jù)進(jìn)行分隔,這個(gè)對(duì)象就是超平面,從概念上說(shuō),支持向量是那些離分隔超平面最近的數(shù)據(jù)點(diǎn),它們決定了最優(yōu)分類超平面的位置。支持向量機(jī)算法的目標(biāo)就是最大化支持向量到分隔面的距離,求解最優(yōu)超平面(能夠?qū)颖緮?shù)據(jù)準(zhǔn)確地分開(kāi),同時(shí)使得分類間隔最大)。由于支持向量機(jī)方法在小樣本、高維模式識(shí)別以及非線性問(wèn)題中所表現(xiàn)出的優(yōu)異性能在故障檢測(cè)與診斷領(lǐng)域引起了廣泛研究。
圖5 支持向量機(jī)最優(yōu)超平面
Poyhonen S等將支持向量機(jī)算法應(yīng)用于在電機(jī)故障診斷,成功將電機(jī)健康功率譜和故障功率分類,識(shí)別出故障[30];Gao JunFeng等將SVM用于往復(fù)式泵閥門(mén)故障診斷中,能夠識(shí)別和診斷故障閥門(mén)的故障類型和位置,與BP神經(jīng)網(wǎng)絡(luò)相比,SVM在機(jī)械故障檢測(cè)中具有更大優(yōu)勢(shì)[31];肖健華分析了支持向量機(jī)模式分類的原理,指出最優(yōu)分類面上的樣本相對(duì)于兩類誤判而言是等概率的而非等風(fēng)險(xiǎn)的,提出了診斷可信度函數(shù),并在特征空間中,對(duì)最優(yōu)分類面進(jìn)行重新設(shè)計(jì)[32];胡壽松根據(jù)SVM能在訓(xùn)練樣本很小的情況下達(dá)到分類推廣的作用,將其作為殘差分類器得到故障檢測(cè)與診斷信息[33]。
為了彌補(bǔ)支持向量機(jī)算法在故障檢測(cè)與診斷中的不足,會(huì)將其與其他算法進(jìn)行結(jié)合優(yōu)化改進(jìn),提高其在故障診斷中的精度和效率。Li等在了解了多尺度動(dòng)態(tài)熵僅考慮低頻分量中的故障信息,可能會(huì)丟棄隱藏在高頻分量中的故障信息,提出了一種基于分層動(dòng)態(tài)熵和支持向量機(jī)的滾動(dòng)軸承故障診斷方法,可以有效提取高、低頻分量中的故障信息[34];Zhou等針對(duì)現(xiàn)有模型在少量訓(xùn)練樣本可用時(shí)的故障識(shí)別準(zhǔn)確率不高,提出了基于集合經(jīng)驗(yàn)?zāi)B(tài)分解、加權(quán)置換熵和改進(jìn)支持向量機(jī)集成分類器相集合的故障診斷方法,該方法可以有效檢測(cè)軸承故障[35];阮婉瑩等則是針對(duì)滾動(dòng)軸承故障振動(dòng)信號(hào)特點(diǎn)(非平穩(wěn)性、低信噪比),而變分模態(tài)分解排列熵可以將非平穩(wěn)信號(hào)分解轉(zhuǎn)化成若干平穩(wěn)模態(tài)分量,經(jīng)過(guò)粒子群算法優(yōu)化的支持向量機(jī)在小樣本、非線性和高維模式識(shí)別問(wèn)題中優(yōu)勢(shì)明顯提高,因此提出了基于變分模態(tài)分解排列熵和粒子群優(yōu)化支持向量機(jī)的故障診斷方法,提高了滾動(dòng)軸承故障診斷準(zhǔn)確率[36];Gangsar針對(duì)某些電機(jī)工作條件下,存在數(shù)據(jù)或信息有限的問(wèn)題,因此提出了基于小波包變換與SVM相結(jié)合的故障診斷方法,同時(shí)考慮了不同小波的影響,成功用于檢測(cè)和隔離感應(yīng)電動(dòng)機(jī)的各種故障[37];Liu等根據(jù)不同的數(shù)據(jù)來(lái)源,分別通過(guò)KNN檢測(cè)異常值以及KNN識(shí)別邊界點(diǎn)兩種方法來(lái)定義支持向量機(jī)中的分類超平面,用于解決故障檢測(cè)中的計(jì)算負(fù)擔(dān)、不平衡數(shù)據(jù)與異常數(shù)據(jù)的問(wèn)題,并對(duì)高速列車(chē)的制動(dòng)系統(tǒng)進(jìn)行故障診斷[38];何慶飛等提出了一種基于灰色理論和支持向量機(jī)的液壓泵故障診斷和壽命預(yù)測(cè)的方法,在了解基于支持向量機(jī)算法所建立的模型精度較低等缺陷后,利用灰色累加生成操作對(duì)原始數(shù)據(jù)進(jìn)行處理以增強(qiáng)數(shù)據(jù)的規(guī)律性,使用最小最終誤差預(yù)測(cè)準(zhǔn)則來(lái)確定嵌入維數(shù)和相關(guān)參數(shù),使用支持向量機(jī)進(jìn)行預(yù)測(cè),最終利用灰色累減生成操作對(duì)預(yù)測(cè)數(shù)據(jù)進(jìn)行還原,得到預(yù)測(cè)結(jié)果,灰色支持向量機(jī)預(yù)測(cè)性能與灰色模型、單一支持向量機(jī)模型相比最優(yōu)[39]。
現(xiàn)代設(shè)備日趨大型化、復(fù)雜化、自動(dòng)化和連續(xù)化,在設(shè)備或系統(tǒng)工作過(guò)程中采集的數(shù)據(jù)通常具有維度高數(shù)據(jù)大(在每個(gè)采樣的時(shí)間點(diǎn)可能會(huì)得到幾十或上百個(gè)維度)、時(shí)間序列鮮明以及數(shù)據(jù)集不平衡等3個(gè)特點(diǎn)。神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)能力、非線性映射能力、對(duì)任意函數(shù)逼近能力、并行計(jì)算能力和容錯(cuò)能力,正好可以基于這些數(shù)據(jù)進(jìn)行故障診斷。神經(jīng)網(wǎng)絡(luò)用語(yǔ)故障診斷的步驟通常如下:
1)通過(guò)信號(hào)監(jiān)測(cè)與分析,抽取反映被測(cè)對(duì)象的特征參數(shù)作為網(wǎng)絡(luò)的輸入;
2)對(duì)被測(cè)對(duì)象的狀態(tài)進(jìn)行編碼;
3)進(jìn)行網(wǎng)絡(luò)設(shè)計(jì),確定網(wǎng)絡(luò)層數(shù)和各層神經(jīng)元數(shù);
4)用各種狀態(tài)數(shù)據(jù)組成訓(xùn)練樣本,輸入網(wǎng)絡(luò),進(jìn)行訓(xùn)練,確定個(gè)單元的連接權(quán)值;
5)把待測(cè)隊(duì)長(zhǎng)的特征參數(shù)作為網(wǎng)絡(luò)的輸入,根據(jù)輸出確定待測(cè)對(duì)象的狀態(tài)類別。
本文主要介紹兩種方法:卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)和遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)。
3.3.1 基于卷積神經(jīng)網(wǎng)絡(luò)的故障檢測(cè)與診斷
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是有一種監(jiān)督學(xué)習(xí)方法,最初由Yann Lecun 于1994年提出,并首次將其用于手寫(xiě)數(shù)字識(shí)別[40],也是第一批能使用反向傳播有效訓(xùn)練的網(wǎng)絡(luò)之一。該模型是一種特殊的多層感知器或前饋神經(jīng)網(wǎng)絡(luò),通常包含輸入層、卷積層、池化層、全連接層和輸出層,卷積層通過(guò)將輸入數(shù)據(jù)通過(guò)核函數(shù)進(jìn)行卷積輸出特征映射;池化層主要是通過(guò)池化函數(shù)對(duì)該層的輸入進(jìn)行調(diào)整,減少模型的可訓(xùn)練參數(shù),提高統(tǒng)計(jì)效率并且減少對(duì)參數(shù)的存儲(chǔ)需求;全連接層通過(guò)整合所有的局部特征進(jìn)而得到全局特征,用于后續(xù)分類。CNN網(wǎng)絡(luò)的訓(xùn)練類似于傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法,采用BP算法將誤差逐層反向傳遞,使用梯度下降法調(diào)整各層之間的參數(shù)。CNN可對(duì)輸入進(jìn)行提取,得到局部特征并逐層組合抽象生成高層特征,可有效實(shí)現(xiàn)故障診斷與識(shí)別[41]。其能夠避免對(duì)圖像、語(yǔ)言等大量復(fù)雜信號(hào)的前期處理工作,輸入的直接是原始數(shù)據(jù),并從中學(xué)習(xí)到不同層級(jí)的特征,近年來(lái)卷積神經(jīng)網(wǎng)絡(luò)在多個(gè)領(lǐng)域都得到應(yīng)用,如語(yǔ)音識(shí)別、人臉識(shí)別、通用物體識(shí)別、運(yùn)動(dòng)分析甚至腦電波分析方面等。
圖6 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
基于CNN算法的優(yōu)越性,即使仍處于探索階段,但是已經(jīng)有很多研究人員將CNN成功應(yīng)用于故障診斷中。魏東等首次提出了采用具有兩個(gè)分類器的CNN網(wǎng)絡(luò)結(jié)構(gòu),這樣就有兩個(gè)輸出序列,該方法只用了一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)就實(shí)現(xiàn)了對(duì)兩種非獨(dú)立分類問(wèn)題的分類,因此就可以解決兩個(gè)故障診斷選項(xiàng)中的非獨(dú)立分類問(wèn)題[42];Olivier Janssens等則采用卷積神經(jīng)網(wǎng)絡(luò)的方法從數(shù)據(jù)中自動(dòng)學(xué)習(xí)用于軸承故障檢測(cè)的特征,實(shí)現(xiàn)齒輪箱的故障檢測(cè)與分類問(wèn)題,與基于隨機(jī)森林分類器的故障診斷準(zhǔn)確率相比,有明顯提高[43];而zhi等人針對(duì)基于齒輪箱的振動(dòng)信號(hào)對(duì)故障的敏感,提出了一種基于CNN算法的齒輪箱故障識(shí)別和分類的實(shí)現(xiàn)方法,通過(guò)振動(dòng)對(duì)信號(hào)進(jìn)行預(yù)處理,使得能量在頻譜峰值處保持其形狀,與專家經(jīng)驗(yàn)系統(tǒng)等傳統(tǒng)的故障診斷方法相比,具有可靠性高以及分辨率高等優(yōu)點(diǎn)[44];Appana 等提出了一種基于聲發(fā)射 分析的軸承診斷方法,利用 CNN 自動(dòng)提取包絡(luò)譜中的滾動(dòng)軸承缺陷特征信息,實(shí)現(xiàn)故障診斷[45];曾雪瓊等使用小波變換、變換、短時(shí)傅里葉變換3種時(shí)頻方法,將故障信號(hào)轉(zhuǎn)換成時(shí)頻譜圖作為 CNN的輸入,通過(guò)分析時(shí)頻圖實(shí)現(xiàn)變速箱的智能故障診斷[46]。程誠(chéng)等利用卷積神經(jīng)網(wǎng)絡(luò)在識(shí)別位移、縮放以及其他形式扭曲不變性的二維圖形的優(yōu)勢(shì),提出了一種結(jié)合雷達(dá)圖和CNN分類算法的故障診斷算法,該算法利用雷達(dá)圖對(duì)數(shù)據(jù)進(jìn)行可視化表示并將其轉(zhuǎn)換為二維圖像數(shù)據(jù),建立合適的卷積神經(jīng)網(wǎng)絡(luò)模型,使其能夠根據(jù)雷達(dá)圖提供的信息進(jìn)行故障診斷,該方法已經(jīng)成功應(yīng)用于工業(yè)過(guò)程[47];Jing等提出了一種能夠自適應(yīng)地從原始數(shù)據(jù)中學(xué)習(xí)特征并發(fā)現(xiàn)新的故障敏感特征的特征自動(dòng)提取方法,卷積神經(jīng)網(wǎng)絡(luò)能夠直接學(xué)習(xí)振動(dòng)信號(hào)的頻率數(shù)據(jù)(原始數(shù)據(jù)、頻譜數(shù)據(jù)以及組合時(shí)頻數(shù)據(jù))從而提取特征參數(shù),該方法已經(jīng)成功對(duì)某型號(hào)的齒輪箱進(jìn)行了故障診斷,與其他診斷方法相比,CNN有更高的診斷精度[48];張偉為了檢測(cè)軸承故障,直接利用卷積神經(jīng)網(wǎng)絡(luò)處理時(shí)域振動(dòng)信號(hào),通過(guò)分析振動(dòng)信號(hào)的特點(diǎn),提出了一種卷積神經(jīng)網(wǎng)絡(luò)框架WDCNN模型,構(gòu)造了第一層大卷積核以及多層小卷積核的WDCNN模型,在CWRU數(shù)據(jù)庫(kù)上的識(shí)別率可以達(dá)到100%[49];Guo Xiaojie等提出了一種基于改進(jìn)算法的分層學(xué)習(xí)速率自適應(yīng)深度卷積神經(jīng)網(wǎng)絡(luò),并將其應(yīng)用于軸承故障診斷和嚴(yán)重程度判定中,根據(jù)測(cè)試設(shè)備的軸承故障數(shù)據(jù)樣本對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行多次訓(xùn)練,最終表明該方法在故障模式識(shí)別和故障規(guī)模評(píng)價(jià)方面有著很好的效果[50]。
3.3.2 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)
循環(huán)神經(jīng)網(wǎng)絡(luò)是從大腦皮層中關(guān)于記憶的神經(jīng)回路和循環(huán)反饋系統(tǒng)研究中獲得的靈感。一般的神經(jīng)網(wǎng)絡(luò)中,雖然層與層之間的節(jié)點(diǎn)是有連接的,但同一層內(nèi)部的節(jié)點(diǎn)不連通。RNN具有一個(gè)循環(huán)結(jié)構(gòu),使得網(wǎng)絡(luò)在某時(shí)刻k的輸出不僅與k時(shí)刻的輸入有關(guān),還和k時(shí)刻以前的輸出有關(guān),這使得RNN有一定的記憶力,能夠獲取多個(gè)時(shí)間步以前的信息。RNN與處理序列和列表類數(shù)據(jù)密切相關(guān),能夠挖掘數(shù)據(jù)中的時(shí)序信息,具有充分利用語(yǔ)義信息的深度表達(dá)能力,在語(yǔ)言模型和文本生成、機(jī)器翻譯、語(yǔ)音識(shí)別、生成圖像描述和時(shí)頻標(biāo)記等方面有出色的應(yīng)用,但是不能很好的處理長(zhǎng)時(shí)依賴的問(wèn)題。目前應(yīng)用于故障診斷領(lǐng)域的有Elman、長(zhǎng)短期記憶(LSTM)和門(mén)控循環(huán)單元(GRU)3種循環(huán)神經(jīng)網(wǎng)絡(luò),其中作為RNN變體結(jié)構(gòu)的LSTM和GRU的應(yīng)用最多,這些變體網(wǎng)絡(luò)可以幫助解決 RNN 中零點(diǎn)梯度的消失問(wèn)題。
RNN能夠提高故障診斷效率,同時(shí)改善了現(xiàn)有神經(jīng)網(wǎng)絡(luò)故障診斷方法,使其能夠適用于復(fù)雜設(shè)備或系統(tǒng)的實(shí)時(shí)故障診斷,具有收斂速度快、精度高、穩(wěn)定性好、擴(kuò)展性好等優(yōu)勢(shì)。Azzam I等提出了一種無(wú)線傳感器網(wǎng)絡(luò)動(dòng)態(tài)模型及其在傳感器節(jié)點(diǎn)故障檢測(cè)的方法,基于 RNN算法模型對(duì)傳感器、傳感器節(jié)點(diǎn)的動(dòng)力學(xué)以及傳感器的內(nèi)部連接耦合性進(jìn)行建模,神經(jīng)網(wǎng)絡(luò)的輸入包括傳感器模型的先前輸出以及相鄰傳感器的當(dāng)前和先前輸出,神經(jīng)網(wǎng)絡(luò)輸出和拓?fù)浣Y(jié)構(gòu)(基于反向傳播型)在一般非線性傳感器模型的基礎(chǔ)上進(jìn)行改進(jìn),并與卡爾曼濾波方法進(jìn)行比較,該方法有著更高的檢測(cè)診斷效率[51];Talebi等采用兩種RNN分別識(shí)別一般未知的執(zhí)行器和傳感器故障,在非線性系統(tǒng)的狀態(tài)和傳感器不確定性較大或含有干擾的情況下,根據(jù)修改的反向傳播方案更新神經(jīng)網(wǎng)絡(luò)的權(quán)重,考慮了地球低軌道衛(wèi)星姿控系統(tǒng)中用于姿態(tài)確定和控制的磁力矩型制動(dòng)器和磁強(qiáng)計(jì)型傳感器,并在姿控系統(tǒng)的故障診斷中驗(yàn)證了該方法的有效性和準(zhǔn)確性[52];Piotr等研究了基于循環(huán)神經(jīng)網(wǎng)絡(luò)和混沌工程進(jìn)行魯棒性故障檢測(cè)的問(wèn)題,提出的方法中的主要部分是由復(fù)雜的動(dòng)態(tài)神經(jīng)單元組成的局部循環(huán)網(wǎng)絡(luò),可獲得混沌行為,采用全局和局部?jī)?yōu)化方法的雙相策略,為了提高效率,混沌工程與退火算法相結(jié)合,同時(shí)提出了殘差評(píng)價(jià)的遞歸量化分析,并在對(duì)模擬工業(yè)數(shù)據(jù)的建模任務(wù)中對(duì)該方法進(jìn)行了驗(yàn)證[53];Yuan等提出了一種基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)在復(fù)雜操作、混合故障和強(qiáng)噪聲的情況下獲得診斷和預(yù)測(cè)的方法,并通過(guò)3種不同的RNN變體(簡(jiǎn)單的RNN,LSTM,GRU)對(duì)NASA提供的飛機(jī)渦輪發(fā)動(dòng)機(jī)健康監(jiān)測(cè)數(shù)據(jù)集進(jìn)行測(cè)試,結(jié)果證明LSTM在故障診斷和剩余使用壽命的效果最好[54];循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)能夠很好地處理序列數(shù)據(jù)以及可變序列數(shù)據(jù)的能力,被廣泛應(yīng)用于數(shù)據(jù)識(shí)別等方面,但RNN存在梯度彌散或梯度爆炸問(wèn)題導(dǎo)致無(wú)法解決長(zhǎng)期依賴問(wèn)題,而LSTM可以通過(guò)防過(guò)擬合、小批量組合、自適應(yīng)學(xué)習(xí)率等優(yōu)化技術(shù)建立長(zhǎng)時(shí)依賴模型,許寅使用LSTM對(duì)航天器的實(shí)測(cè)數(shù)據(jù)進(jìn)行學(xué)習(xí)和預(yù)測(cè),可以實(shí)現(xiàn)航天器在軌狀態(tài)的高精度的中長(zhǎng)期預(yù)測(cè)[55];牛哲文等提出一種風(fēng)功率預(yù)測(cè)模型,該模型以風(fēng)電場(chǎng)風(fēng)功率歷史數(shù)據(jù)以及風(fēng)速、風(fēng)向等數(shù)值天氣預(yù)報(bào)數(shù)據(jù)作為輸入對(duì)風(fēng)功率進(jìn)行預(yù)測(cè),考慮到風(fēng)功率預(yù)測(cè)中輸入數(shù)據(jù)的波動(dòng)性和不確定性,在傳統(tǒng)門(mén)控循環(huán)單元(GRU)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上融合卷積神經(jīng)網(wǎng)絡(luò)(CNN),以提高模型對(duì)原始數(shù)據(jù)的特征提取和降維能力,并引入dropout技術(shù)減少模型中的過(guò)擬合現(xiàn)象,結(jié)果表明在短期風(fēng)功率預(yù)測(cè)精度和運(yùn)算速度方面要優(yōu)于LSTM[56]。
機(jī)器學(xué)習(xí)已經(jīng)成為當(dāng)前技術(shù)發(fā)展熱點(diǎn),并由于其良好的自學(xué)習(xí)、識(shí)別、分類能力,在故障檢測(cè)與診斷技術(shù)中受到了越來(lái)越多的關(guān)注。本文系統(tǒng)介紹了機(jī)器學(xué)習(xí)和故障檢測(cè)以及故障診斷的概念、分類,深入了解了基于機(jī)器學(xué)習(xí)的故障檢測(cè)與故障診斷方法。重點(diǎn)介紹了基于PCA和隨機(jī)森林的故障檢測(cè)方法,給出了兩種方法的基本思路以及國(guó)內(nèi)外的研究現(xiàn)狀;基于機(jī)器學(xué)習(xí)的故障診斷方法主要包括決策樹(shù)、支持向量機(jī)以及神經(jīng)網(wǎng)絡(luò),將重點(diǎn)放在最近比較新的CNN和RNN在故障診斷中的應(yīng)用,給出了這幾種方法的研究現(xiàn)狀。通過(guò)對(duì)相關(guān)文獻(xiàn)的梳理總結(jié),機(jī)器學(xué)習(xí)在機(jī)故障檢測(cè)和診斷領(lǐng)域仍有如下幾個(gè)方面需要研究:
1)目前在故障檢測(cè)與診斷領(lǐng)域應(yīng)用的機(jī)器學(xué)習(xí)方法還是根據(jù)設(shè)備或系統(tǒng)的歷史故障數(shù)據(jù)進(jìn)行訓(xùn)練,必須要將故障數(shù)據(jù)累積到一定量才能進(jìn)行分析,但是故障數(shù)據(jù)的完整收集難以實(shí)現(xiàn),如何根據(jù)有限的故障數(shù)據(jù)進(jìn)行故障分析預(yù)測(cè)將會(huì)是今后發(fā)展的一個(gè)重要趨勢(shì);
2)目前的方法大多是基于大量的離線數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)采集過(guò)程隨著先進(jìn)儀器設(shè)備的發(fā)展也會(huì)越來(lái)越容易,如何對(duì)海量數(shù)據(jù)進(jìn)行壓縮、提取等數(shù)據(jù)預(yù)處理技術(shù),以及在線實(shí)時(shí)數(shù)據(jù)分析的技術(shù)方法的發(fā)展,將直接影響到后續(xù)基于數(shù)據(jù)的故障檢測(cè)與診斷;
3)機(jī)器學(xué)習(xí)算法的運(yùn)用現(xiàn)狀還僅僅局限于材料試件與局部構(gòu)件,設(shè)備的復(fù)雜度、精細(xì)度以及設(shè)備間的耦合,距離實(shí)現(xiàn)重大設(shè)備或系統(tǒng)整體的故障檢測(cè)和診斷還有較大的差距,這是未來(lái)機(jī)器學(xué)習(xí)算法需要突破的一個(gè)重大難點(diǎn);
4)機(jī)器學(xué)習(xí)模型多種多樣,每種模型都有自己的優(yōu)缺點(diǎn),同時(shí)機(jī)器學(xué)習(xí)又具有良好的學(xué)習(xí)能力,這是實(shí)現(xiàn)智能故障診斷的一個(gè)有力武器。如何能夠?qū)崿F(xiàn)機(jī)器學(xué)習(xí)各模型間的有效結(jié)合,揚(yáng)長(zhǎng)避短,可能是未來(lái)研究的一個(gè)方向;
5)由于信號(hào)處理方法可以診斷針對(duì)采集到的原始收據(jù)進(jìn)行分析,基于分析模型的方法可以涵蓋系統(tǒng)的各種機(jī)理知識(shí)、數(shù)據(jù)知識(shí)和經(jīng)驗(yàn)知識(shí),而機(jī)器學(xué)習(xí)則可以實(shí)現(xiàn)故障診斷的自學(xué)習(xí),因此可以對(duì)這3種方法的方法進(jìn)一步融合,如何使得三者相互支持、相互補(bǔ)充將會(huì)成為一個(gè)有意義的研究方向。