邢礫文,姚文凱,黃 瑩
(1.武警工程大學(xué) 研究生大隊,西安 710086;2.武警工程大學(xué) 信息工程學(xué)院,西安 710086)
裝備故障診斷通過分析裝備狀態(tài)的相關(guān)數(shù)據(jù),對裝備運行狀態(tài)和異常情況作出判斷,為裝備故障恢復(fù)提供依據(jù)。隨著科學(xué)技術(shù)的發(fā)展,現(xiàn)代裝備正朝著集成化方向發(fā)展,系統(tǒng)之間交叉鏈接使系統(tǒng)的復(fù)雜性日益增加,隨著數(shù)據(jù)采集設(shè)備的增多和數(shù)字信息的推廣,裝備故障診斷已經(jīng)變得越來越大數(shù)據(jù)化。傳統(tǒng)的人工分析方法難以適應(yīng)這些變化,需要計算機和人工智能的幫助才能進行準確的故障診斷,對智能化的要求越來越高。
在傳統(tǒng)的故障診斷方法中,特征提取是最關(guān)鍵的步驟,它直接決定了故障診斷的效果。經(jīng)過多年的發(fā)展,故障診斷具有許多特征,如時域特征、頻域特征、小波能量熵和經(jīng)驗?zāi)B(tài)分解等。然而,這些特征大多是經(jīng)過大量的實驗和經(jīng)驗得到的,需要很長時間才能獲得,而且過分依賴專家經(jīng)驗知識。對于新的或特定的研究對象,很難決定應(yīng)該選擇哪些特征,影響故障診斷效果。
近年來,深度學(xué)習(xí)在圖像識別、語音處理和文本處理方面具有良好的表現(xiàn)。深度學(xué)習(xí)是人工智能的一個子域,因其多隱層網(wǎng)絡(luò)與自適應(yīng)的特征提取能力而能夠挖掘數(shù)據(jù)更深層次的本質(zhì)特征,利用原始信號的所有特征,不舍棄原始數(shù)據(jù)信息,能精確地刻畫故障數(shù)據(jù)從觀測值到故障類別之間復(fù)雜的映射關(guān)系,實現(xiàn)智能故障診斷。首先,與傳統(tǒng)的故障診斷方法相比,深度學(xué)習(xí)具有較強的學(xué)習(xí)能力,可以從大量數(shù)據(jù)中學(xué)習(xí)特征,減少或消除了故障診斷對專家知識的依賴。其次,深度學(xué)習(xí)具有表達復(fù)雜關(guān)系的能力,可以準確地描述從傳感器信號到設(shè)備健康狀態(tài)的復(fù)雜映射。此外,深度學(xué)習(xí)非常適用于大數(shù)據(jù)背景下設(shè)備系統(tǒng)的狀態(tài)監(jiān)測和故障診斷。最后,深度學(xué)習(xí)具有遷移學(xué)習(xí)的能力,能夠從源域中學(xué)習(xí)知識,并通過這些知識協(xié)助目標域的分類問題。因此,具有這些優(yōu)點的深度學(xué)習(xí)將被深入研究,并在集成化裝備故障診斷領(lǐng)域得到更廣泛的應(yīng)用。
本文按照應(yīng)用領(lǐng)域的不同,分析和總結(jié)了近年來國內(nèi)外的研究現(xiàn)狀,介紹了幾種典型的基于深度學(xué)習(xí)的故障診斷方法:深度置信網(wǎng)絡(luò)(deep belief networks,DBN)、堆棧自編碼機(stacked auto-encoders,SAE)、卷積神經(jīng)網(wǎng)絡(luò)(convolution neural networks,CNN),并做出總結(jié),討論了深度學(xué)習(xí)在集成化裝備故障診斷領(lǐng)域面臨的挑戰(zhàn)與發(fā)展方向。
正是由于深度學(xué)習(xí)的明顯優(yōu)勢,基于深度學(xué)習(xí)的故障診斷方法在機械、電子系統(tǒng)等領(lǐng)域得到了廣泛應(yīng)用,并不斷在新的領(lǐng)域嘗試。
在軸承領(lǐng)域,文獻[1]利用DBN完成特征提取,結(jié)合支持向量數(shù)據(jù)描述方法(support vector data description,SVDD)實現(xiàn)異常數(shù)據(jù)檢測。無需故障樣本數(shù)據(jù)即可完成故障診斷,但只能檢測出異常,不能判斷故障類型。文獻[2]通過網(wǎng)格搜索算法進行參數(shù)尋優(yōu),改善手動調(diào)節(jié)參數(shù)沒有依據(jù)的問題。搭建分布式并行計算平臺解決該算法尋優(yōu)時間過長的問題。文獻[3]利用DBN提取特征,計算重構(gòu)誤差,檢測其趨勢變化,并將此作為故障判斷準則。該方法能夠?qū)崿F(xiàn)故障診斷但不能對故障進行分類。文獻[4-6]分別將深度編碼網(wǎng)絡(luò)、堆疊去噪自編碼器與支持向量機(support vector machine,SVM) 結(jié)合。首先利用神經(jīng)網(wǎng)絡(luò)提取特征,然后利用SVM進行分類。文獻[6]將頻譜特征與時域特征相融合,利用鯨魚優(yōu)化算法進行優(yōu)化,實現(xiàn)了不同工況下多種故障類型的可靠識別。文獻[7]先利用滑動窗口重疊采樣技術(shù)進行數(shù)據(jù)增強,再通過堆疊去噪自編碼器降噪,然后通過反向傳播算法(back propagation,BP)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)雙層分類器,識別出故障模式及故障程度,最后用集成學(xué)習(xí)投票法提高識別準確率。文獻[8]先采用經(jīng)驗?zāi)B(tài)分解方法分析信號,然后利用堆疊稀疏自編碼器進行故障診斷,具有較高準確率。文獻[9]改進了小波自編碼器,能識別出多種故障類型及故障程度。文獻[10]將聯(lián)合領(lǐng)域自適應(yīng)算法與CNN結(jié)合,解決了訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)來自不同概率分布的問題。文獻[11]改進了深度全序列卷積神經(jīng)網(wǎng)絡(luò),利用它進行精確診斷。然后,提出改進后CDCGAN方法,實現(xiàn)由已知數(shù)據(jù)生成未知數(shù)據(jù)、由單一數(shù)據(jù)生成復(fù)合數(shù)據(jù),擴充了故障樣本。文獻[12-15]分別利用小波變換、同步擠壓S變換、離散小波變換、短時傅里葉變換對采集到的時域振動信號進行處理,得到時頻圖像或構(gòu)造時頻矩陣,然后再將其輸入CNN進行故障診斷。
在齒輪箱領(lǐng)域,文獻[16]將故障樣本振動信號輸入DBN,通過對狀態(tài)變量進行編碼和解碼,計算重構(gòu)誤差并將其作為狀態(tài)檢測量,但該方法不能實現(xiàn)對故障的分類。文獻[17-18]在多噪聲干擾情況下,提出了一種多樣性故障特征提取與集成學(xué)習(xí)信息融合的故障診斷方法,提高了故障識別能力和分類穩(wěn)定性,對噪聲的魯棒性強。在少故障樣本信息情況下,將堆疊去噪自編碼器的去噪能力和生成式對抗網(wǎng)絡(luò)(generative adversarial nets,GAN)的樣本生成能力結(jié)合起來,解決故障樣本少的問題。
在變壓器領(lǐng)域,文獻[19-20]分別利用棧式降噪自編碼器、棧式稀疏自編碼器進行故障診斷。采取逐層貪婪編碼的方式進行自適應(yīng)的非監(jiān)督式預(yù)訓(xùn)練,實現(xiàn)高維深層故障特征的自適應(yīng)提取和挖掘,進而使用反向傳播算法對模型進行監(jiān)督式微調(diào)。最后利用 Softmax分類器,對故障進行分類輸出。
在通信電臺領(lǐng)域,鞠建波[21]等人使用去噪自動編碼器搭建網(wǎng)絡(luò),通過BP算法進行有監(jiān)督微調(diào),提升故障分類的準確度。利用上述方法,通過實驗完成了某通信電臺的模塊級故障診斷。劉程[22]等人利用深度堆棧自編碼網(wǎng)絡(luò)和Softmax分類器完成了短波發(fā)信機的故障診斷。
在其他領(lǐng)域[23-42],王新穎[23]等人運用小波分析法提取特征參數(shù),利用DAE進行重構(gòu),具有更高的穩(wěn)定性和辨識率。其中,文獻[24]將原始數(shù)據(jù)分割,根據(jù)故障類型和故障程度設(shè)計多個CNN,實現(xiàn)分層故障診斷,該方法負載發(fā)生變化時仍有較高識別率,魯棒性、泛化性較好。文獻[25]基于特征學(xué)習(xí)對LeNet進行了改進,提高了處理海量數(shù)據(jù)的能力以及泛化能力。吳魁[26]等人對于多傳感器信號,通過構(gòu)建測量數(shù)據(jù)幀進行卷積計算,實現(xiàn)多通道數(shù)據(jù)的自然融合。解決了多傳感器數(shù)據(jù)融合、特征提取困難等問題。文獻[27]利用Skip-gram模型進行詞向量訓(xùn)練,并將詞向量作為卷積神經(jīng)網(wǎng)絡(luò)輸入。文獻[28]先把原始數(shù)據(jù)制作為語音形式,再將其轉(zhuǎn)化為語譜圖,最后送入VGG16模型中。王應(yīng)晨[29]等人先通過堆疊去噪自編碼器學(xué)習(xí)低層特征,然后通過DBN學(xué)習(xí)深層特征,最后輸入Softmax分類器進行分類。李垣江[30]等人將GAN與堆疊稀疏自編碼器相結(jié)合,增加數(shù)據(jù)集的多樣性,提高網(wǎng)絡(luò)泛化能力。黃予春[31]等人將云計算技術(shù)引入深度學(xué)習(xí),將海量故障數(shù)據(jù)切片,再利用DBN進行分布式并行處理,有效實現(xiàn)了大數(shù)據(jù)條件下的故障診斷。李川[32]等人提出次優(yōu)網(wǎng)絡(luò),在傳統(tǒng)DBN的基礎(chǔ)上,一方面提出預(yù)分類方法,確定更好的網(wǎng)絡(luò)結(jié)構(gòu),另一方面采用精細分類方法,提高分類的精度。文獻[39]使用自適應(yīng)算法優(yōu)化DBN,實現(xiàn)學(xué)習(xí)速率的自適應(yīng)變化。
受文獻[43]的啟迪,2006年辛頓教授提出了深度學(xué)習(xí)理論[44]。文獻[45]首次將深度置信網(wǎng)絡(luò)應(yīng)用于飛機發(fā)動機故障診斷,此后越來越多的學(xué)者將深度學(xué)習(xí)應(yīng)用于故障診斷領(lǐng)域,并取得了許多研究成果。
在軸承領(lǐng)域,文獻[46]通過設(shè)計多尺度卷積層,減少了網(wǎng)絡(luò)參數(shù)和訓(xùn)練時間,提高了診斷精度和魯棒性,使運行更順暢。文獻[47]將遷移學(xué)習(xí)與CNN相結(jié)合,將離線CNN的淺層遷移到在線CNN,實現(xiàn)進行在線故障診斷,提高診斷的實時性及準確率。文獻[48]也將遷移學(xué)習(xí)與CNN相結(jié)合,解決了故障數(shù)據(jù)少、訓(xùn)練數(shù)據(jù)與實際數(shù)據(jù)來自不同分布的問題。文獻[49]利用復(fù)Morlet小波的連續(xù)小波變換對采集到的時域振動信號進行處理,得到時頻圖像或構(gòu)造時頻矩陣,然后再將其輸入CNN進行故障診斷。文獻[50]提出了一種將信號轉(zhuǎn)換為圖像的新算法。文獻[51]將遷移學(xué)習(xí)與堆疊稀疏自編碼器相結(jié)合,獲得較高的診斷精度。文獻[52]采用時變學(xué)習(xí)率的思想,在保證迭代率的基礎(chǔ)上,減少了迭代過程中成本函數(shù)的振蕩,提取的特征更有利于故障分類。
在旋轉(zhuǎn)機械領(lǐng)域,文獻[53]將振動信號的頻域信息輸入堆疊去噪自編碼器,采用dropout技術(shù)調(diào)整網(wǎng)絡(luò)參數(shù),緩解過擬合的發(fā)生。文獻[54]首先從傳感器信號中提取時域、頻域特征,然后利用SAE進行特征融合,最后利用DBN進一步分類。文獻[55]采用非線性投影實現(xiàn)壓縮采集,然后通過堆疊稀疏自編碼器進行故障診斷,提供了處理海量數(shù)據(jù)的新策略。文獻[56]將SAE與階次跟蹤相結(jié)合,適應(yīng)恒速和變速條件,可以對故障類型和故障程度進行分類。文獻[57]將CNN與多堆棧膠囊相結(jié)合,能夠有效地識別和解耦復(fù)合故障。
在電機領(lǐng)域,文獻[58]采用擴張卷積神經(jīng)網(wǎng)絡(luò),能夠處理一維數(shù)據(jù),無需手工特征提取,泛化性好。文獻[59]將電機速度考慮在內(nèi),將振動信號視為圖像輸入CNN,通過降低模型復(fù)雜性減少了過度擬合并提高了精度。
在齒輪箱領(lǐng)域,文獻[60]將故障樣本振動信號輸入DBN,增加了批量標準化,降低過度擬合概率,提高收斂速度。文獻[61]使用多個噪聲級別來訓(xùn)練AE,具有更好的魯棒性,更高的準確率。文獻[62]提出了一種新的多尺度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可同時進行多尺度特征提取和分類。
文獻[63-69]分別對航空發(fā)動機、感應(yīng)電動機、風(fēng)力發(fā)電機、液壓設(shè)備、懸鏈支撐裝置緊固件、無人機系統(tǒng)、航空發(fā)動機傳感器進行故障診斷。其中,文獻[64]基于粒子群對網(wǎng)絡(luò)進行了優(yōu)化。文獻[67]按從粗到精的方式級聯(lián)3個基于深度卷積神經(jīng)網(wǎng)絡(luò)的檢測階段,在復(fù)雜環(huán)境下具有較高的檢測率、良好的適應(yīng)性和魯棒性。文獻[68]利用線性二次調(diào)節(jié)控制器產(chǎn)生故障信號,并將其轉(zhuǎn)化為圖像,利用時頻振幅圖中的彩色圖像進行故障分類。文獻[69]利用主成分分析法進行降維,提高算法效率。
目前較為熟悉的深度學(xué)習(xí)模型主要包括以下3種:DBN、SAE、CNN。
DBN由多個限制玻爾茲曼機(restricted boltzmann machine,RBM)堆疊而成,其核心是用逐層貪婪學(xué)習(xí)算法去優(yōu)化深度神經(jīng)網(wǎng)絡(luò)的連接權(quán)重,即使用無監(jiān)督學(xué)習(xí)方式進行逐層訓(xùn)練,較低層的DBN可以提取低級特征,而較高層用于表示輸入數(shù)據(jù)的更抽象的特征。以圖1為例,本文的DBN由三層RBM堆疊而成,每個RBM是一個雙層能量模型,由可見層與隱含層組成,連接僅存在于輸入層的可見單元和隱含層的隱藏單元之間。
圖1 DBN結(jié)構(gòu)
DBN學(xué)習(xí)過程包括兩個階段:第一階段,逐步預(yù)訓(xùn)練RBM層。將訓(xùn)練數(shù)據(jù)輸入到可見層中,訓(xùn)練第一層RBM,低層RBM的輸出作為高一層RBM的輸入,重復(fù)該訓(xùn)練過程,直到最后一層RBM訓(xùn)練完畢。第二階段,微調(diào)整個網(wǎng)絡(luò)以調(diào)整參數(shù)實現(xiàn)理想的性能。在微調(diào)階段,為分類問題添加表示所需輸出的最后一層變量,并使用反向傳播算法(back propagation,BP)優(yōu)化整個權(quán)重和偏差。
DBN有很多優(yōu)勢。首先,它能夠自適應(yīng)地提取出故障特征,不需要依賴于大量信號處理技術(shù)以及專家經(jīng)驗,能夠?qū)崿F(xiàn)智能化的故障診斷;其次,它不需要時域信號具有周期性,因此能廣泛適用于諸多領(lǐng)域;最后,它能夠處理高維、非線性數(shù)據(jù),適合大數(shù)據(jù)時代的集成化裝備故障診斷。
基于DBN的故障診斷可以達到較高的精確度。針對故障數(shù)據(jù)少的問題,可以通過仿真系統(tǒng)進行模擬,產(chǎn)生大量故障信號。針對超參數(shù)設(shè)置對網(wǎng)絡(luò)效果有較大影響的問題,可以采用超參數(shù)自動優(yōu)化方法,如網(wǎng)格搜索、隨機搜索算法、遺傳算法、粒子群算法,貝葉斯優(yōu)化算法等。其中網(wǎng)格搜索與隨機搜索最為簡單實用,但網(wǎng)格搜索適用于極少超參數(shù)的優(yōu)化。網(wǎng)格搜索的計算復(fù)雜度會隨著超參數(shù)數(shù)量增長而指數(shù)型增長,隨機搜索一定程度上避免了這個問題。針對網(wǎng)絡(luò)訓(xùn)練時間長的問題,可以搭建分布式并行計算平臺。針對網(wǎng)絡(luò)收斂速度慢,可能發(fā)生過度擬合的問題,可以增加批量標準化。為了確定網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)、提高分類精度,可以利用次優(yōu)網(wǎng)絡(luò)。此外,DBN成功地與云計算相結(jié)合,適合處理大數(shù)據(jù)背景下的故障診斷。
基于DBN的故障診斷還面臨許多挑戰(zhàn)。在搭建網(wǎng)絡(luò)時,還存在網(wǎng)絡(luò)深度不夠的問題。實驗時需要設(shè)定很多參數(shù),這些參數(shù)對實驗結(jié)果有非常大的影響,如何設(shè)置參數(shù)也是一個值得研究的問題。實驗數(shù)據(jù)與實際數(shù)據(jù)還存在很大差異,如何利用實驗得到的模型對實際運行中的數(shù)據(jù)進行高準確率的故障診斷也是值得研究的方向。
堆棧自編碼器由多個自編碼器堆疊而成。自編碼器(autoencoder,AE)是一個只有一個隱藏層的對稱神經(jīng)網(wǎng)絡(luò)。AE包含編碼器網(wǎng)絡(luò)和解碼器網(wǎng)絡(luò)。編碼器網(wǎng)絡(luò)將輸入數(shù)據(jù)從高維空間轉(zhuǎn)換為具有較低維度的特征空間,而解碼器網(wǎng)絡(luò)可以從特征空間重建輸入數(shù)據(jù)。由于AE可以在沒有標簽信息的幫助下重建輸入信號,因此它可以以無監(jiān)督方式學(xué)習(xí),可用于提取原始數(shù)據(jù)的典型特征。AE的基本結(jié)構(gòu)如圖2所示。
圖2 AE結(jié)構(gòu)
由于AE的固有特性是提取原始信號的有意義的特征,并在輸出層恢復(fù)它們,因此應(yīng)避免簡單地從輸入層復(fù)制到隱含層。AE的許多變種可以彌補這個缺點,例如去噪自動編碼器(denoising autoencoder,DAE)和稀疏自動編碼器(sparse autoencoder,SAE)。它們堆疊起來就是堆疊去噪自編碼器(stacked denoising autoencoder,SDAE)和堆疊稀疏自動編碼器(stacked sparse autoencoder,SSAE)。DAE為了提高AE的魯棒性,給輸入數(shù)據(jù)附加額外噪聲的污染,訓(xùn)練自動編碼器模型以重建完整的無噪聲數(shù)據(jù)。SAE是通過懲罰隱含層單元的偏差來學(xué)習(xí)相對稀疏特征的經(jīng)典變體之一。它提高了傳統(tǒng)AE的性能,展現(xiàn)了更多的實際應(yīng)用價值。
在預(yù)訓(xùn)練階段,采用逐層貪婪算法由低到高單獨訓(xùn)練每個AE,低層AE的隱含層輸出作為高層AE的輸入,直至完成所有AE的訓(xùn)練。而后利用BP算法、梯度下降算法等進行微調(diào),最后輸出結(jié)果。
堆棧自編碼機有很多優(yōu)點。首先,它具有很強的表達能力,可以減少冗余數(shù)據(jù),降低維數(shù),適合處理高維稀疏數(shù)據(jù)。同時,它可以降低噪聲的影響,無需對信號進行降噪處理。最后,它使用少量數(shù)據(jù)進行訓(xùn)練,再加上適當(dāng)?shù)姆诸惣夹g(shù)就可以實現(xiàn)高效的故障診斷,體現(xiàn)了強大的特征提取能力和魯棒性。
基于SAE的故障診斷不僅可以判斷故障類型,還可以有效識別故障程度。堆棧自編碼機與DBN相結(jié)合,可以進行進一步故障分類;與滑動窗口重疊采樣技術(shù)相結(jié)合,可以對數(shù)據(jù)進行增強;與遷移學(xué)習(xí)相結(jié)合,可以解決訓(xùn)練集與測試集來自不同分布的問題;與階次跟蹤相結(jié)合,可以在恒速和變速條件下自動進行旋轉(zhuǎn)機械故障診斷;與集成學(xué)習(xí)信息融合,可以進一步提高故障識別能力和分類穩(wěn)定性;與GAN相結(jié)合,可以生成故障數(shù)據(jù),解決故障數(shù)據(jù)不足的問題;與非線性投影相結(jié)合,進行壓縮采集,可以有效處理海量數(shù)據(jù)。
雖然SAE已經(jīng)成功應(yīng)用于很多領(lǐng)域,但還有很多問題需要研究:如何合理設(shè)置網(wǎng)絡(luò)的隱藏層層數(shù)、節(jié)點數(shù);如何對梯度下降法進行改進,從而獲得更好的局部極值點,甚至是全局最優(yōu)點;如何判斷所學(xué)特征的優(yōu)劣,并且如何做以解釋;如何在大數(shù)據(jù)、高維、多樣化的數(shù)據(jù)背景下進行故障診斷等等。
卷積神經(jīng)網(wǎng)絡(luò)由Yann LeCun提出,是第一個成功訓(xùn)練多層網(wǎng)絡(luò)的算法,也是最廣泛使用的深度學(xué)習(xí)模型之一,具有強大的特征提取能力。典型的卷積神經(jīng)網(wǎng)絡(luò)LeNet-5的結(jié)構(gòu)如圖3所示。網(wǎng)絡(luò)分為輸入層、卷積層、子采樣層、全連接層和輸出層。
圖3 LeNet-5結(jié)構(gòu)
卷積層也稱為特征提取層,卷積層通過不同的卷積核卷積前一層,每個卷積核對應(yīng)于一個提取的特征,與前一層的感受野連接。卷積核共享網(wǎng)絡(luò)權(quán)重,每個卷積核提取有限的信息,因此通常使用多個卷積內(nèi)核來獲取更多特征。子采樣層也稱為特征映射層,對從卷積層提取的特征進行子采樣。通過子采樣,大大減少節(jié)點數(shù)量,有效減少了網(wǎng)絡(luò)連接數(shù)量和網(wǎng)絡(luò)計算的復(fù)雜性。全連接層中的所有神經(jīng)元節(jié)點都與前一層節(jié)點互連。
用于解決分類問題的卷積神經(jīng)網(wǎng)絡(luò)包括兩個過程:訓(xùn)練和測試。訓(xùn)練集用于訓(xùn)練網(wǎng)絡(luò),然后將測試集中的樣本輸入到訓(xùn)練的網(wǎng)絡(luò)以測試網(wǎng)絡(luò)的分類效果。訓(xùn)練過程需要前向和反向傳播,而測試過程只需要前向傳播。模型訓(xùn)練結(jié)束后,即可用于分類。
CNN有很多優(yōu)點。它具有良好的容錯能力、并行處理能力和自學(xué)習(xí)能力,可以處理環(huán)境信息復(fù)雜、背景知識不清楚、推理規(guī)則不明確情況下的問題,允許樣品有較大的破損、畸變,運行速度快,自適應(yīng)性好。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比,CNN引入了權(quán)值共享和感受野的概念,減少了需要學(xué)習(xí)的參數(shù)量,擁有更強的學(xué)習(xí)能力,適合處理高維數(shù)據(jù),能夠?qū)W習(xí)海量數(shù)據(jù)中的特征。CNN不僅可以處理一維數(shù)據(jù),還擅長處理二維數(shù)據(jù)。
基于CNN的故障診斷有很多成功的經(jīng)驗:將聯(lián)合領(lǐng)域自適應(yīng)算法與CNN結(jié)合,可以解決訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)來自不同概率分布的情況下診斷準確率低的問題;將CGAN與DCGAN結(jié)合,提出CDCGAN,可以實現(xiàn)從單一故障和部分復(fù)合故障樣本,生成指定類別復(fù)合故障樣本,解決了故障數(shù)據(jù)少的問題;把原始數(shù)據(jù)分段,設(shè)計多個CNN,可以實現(xiàn)分層故障診斷,診斷出故障類別和程度;利用深度解耦卷積神經(jīng)網(wǎng)絡(luò)可以有效識別、解耦復(fù)合故障;通過構(gòu)建測量數(shù)據(jù)幀進行卷積計算可以將多傳感器數(shù)據(jù)進行融合;CNN與主成分分析法相結(jié)合可以進行降維,提高效率。
基于CNN的故障診斷還面臨著很多挑戰(zhàn):如何對數(shù)據(jù)進行預(yù)處理,以避免神經(jīng)元被過度激活,出現(xiàn)收斂失敗的現(xiàn)象;如何合理設(shè)置網(wǎng)絡(luò)參數(shù),達到最佳診斷效果;如何尋找合適的策略對參數(shù)進行優(yōu)化;如何提高模型的可擴展性,實現(xiàn)對新故障的識別;如何提高CNN提取泛化特征的能力;如何使實驗結(jié)果更貼近于實際條件,提高模型的穩(wěn)健性;CNN適合對哪些領(lǐng)域進行故障診斷等等。
1)典型深度學(xué)習(xí)算法直接應(yīng)用。深度學(xué)習(xí)應(yīng)用于一些新的領(lǐng)域,還未進一步發(fā)展,或典型深度學(xué)習(xí)算法已能達到較好診斷效果時,一般可以直接應(yīng)用。
2)深度學(xué)習(xí)算法之間的結(jié)合。DBN、SAE、CNN之間相互結(jié)合或同種算法的結(jié)合,可以應(yīng)用于不同診斷階段,按照從粗到精的順序?qū)崿F(xiàn)分層故障診斷,診斷出故障類別及程度,或者一個用作特征提取,另一個用作分類器。同時,典型神經(jīng)網(wǎng)絡(luò)還可以與GAN相結(jié)合,利用GAN的樣本生成能力解決故障數(shù)據(jù)不足的問題。
3)深度學(xué)習(xí)算法與淺層學(xué)習(xí)算法的結(jié)合。淺層學(xué)習(xí)算法主要有BP算法、SVM、Boosting、最大熵方法等。淺層學(xué)習(xí)算法網(wǎng)絡(luò)層數(shù)少,特征提取能力有限,難以解決復(fù)雜分類問題。其中,BP算法被廣泛應(yīng)用于微調(diào)網(wǎng)絡(luò)參數(shù),SVM也與深度學(xué)習(xí)成功結(jié)合,可以利用深度神經(jīng)網(wǎng)絡(luò)進行特征提取,利用SVM進行分類。傳統(tǒng)SVM只能進行二分類,改進后可以實現(xiàn)多分類。
4)深度學(xué)習(xí)算法與信號處理方法的結(jié)合??梢岳眯〔ㄗ儞Q、傅里葉變換、S變換、經(jīng)驗?zāi)B(tài)分解等方式對信號進行處理,或利用Skip-gram模型進行詞向量訓(xùn)練,也可以把原始數(shù)據(jù)制作為語譜圖,再輸入神經(jīng)網(wǎng)絡(luò)。通過信號處理,可以充分展現(xiàn)故障特征,提高故障診斷效果。
5)深度學(xué)習(xí)算法與其他機器學(xué)習(xí)算法的結(jié)合。
(1)與模糊聚類方法相結(jié)合。模糊聚類方法屬于無監(jiān)督學(xué)習(xí),常用算法有模糊C均值聚類、可能性C-均值聚類等,能夠根據(jù)數(shù)據(jù)的相似性進行故障分類,可以提高分類效果或用于未知故障的學(xué)習(xí)。
(2)與遷移學(xué)習(xí)相結(jié)合能夠解決實驗數(shù)據(jù)與實際數(shù)據(jù)來自不同概率分布條件下故障診斷準確率低的問題。
(3)與主成分分析法相結(jié)合,可以對數(shù)據(jù)進行降維,提高診斷效率,適用于海量數(shù)據(jù)的故障診斷。
6)深度學(xué)習(xí)算法與其他技術(shù)的融合
(1)與云計算相結(jié)合適用于大數(shù)據(jù)背景下的故障診斷。
(2)與數(shù)據(jù)融合技術(shù)相結(jié)合。故障診斷的數(shù)據(jù)可能來自不同傳感器,具有不同的數(shù)據(jù)類型,需要進行數(shù)據(jù)融合后再利用深度學(xué)習(xí)進行故障診斷。
根據(jù)以上分析,可以將面臨的挑戰(zhàn)劃分為以下6種類型,提出了幾種可行的研究思路:
深度學(xué)習(xí)的方法是建立在大數(shù)據(jù)基礎(chǔ)上的,然而,集成化裝備通常具有大量正常運行數(shù)據(jù)和少量有效的故障數(shù)據(jù),如何從大量正常數(shù)據(jù)中識別出小樣本的故障數(shù)據(jù)是一個值得研究的問題。同時,故障樣本的種類有限,難以涵蓋所有類型,對于裝備運行中出現(xiàn)的新故障類型難以進行有效診斷。
首先,對于小樣本故障數(shù)據(jù)識別的問題,可以利用深度學(xué)習(xí)網(wǎng)絡(luò)提取特征,正常數(shù)據(jù)與異常數(shù)據(jù)的特征會有較大偏差,利用基于SVDD的異常檢測器就可以檢測出異常。同時,對于故障數(shù)據(jù)數(shù)量、種類少的問題,可以利用仿真軟件進行模擬,獲取故障數(shù)據(jù)樣本,或者將深度學(xué)習(xí)網(wǎng)絡(luò)與GAN相結(jié)合,擴張故障數(shù)據(jù)集,利用已知單一故障樣本和復(fù)合故障樣本生成未知復(fù)合故障樣本。
為了全面地監(jiān)測集成化裝備的運行狀態(tài),可能使用多種類型的傳感器采集不同信號,如:聲音、振動、電壓、溫度等。各傳感器數(shù)據(jù)類型不統(tǒng)一,給集成化裝備的故障診斷帶來了困擾。
可以通過數(shù)據(jù)融合,將所有傳感器信號轉(zhuǎn)化為同一類型的數(shù)據(jù),有利于信號的存儲和處理,從而實現(xiàn)基于深度學(xué)習(xí)的集成化裝備故障診斷。
隨著集成化裝備信號采集設(shè)備的增多和運行時間的積累,最終會獲得海量數(shù)據(jù),故障診斷已經(jīng)變得越來越大數(shù)據(jù)化。
CNN具有強大的特征提取能力,可以輸入一維或二維數(shù)據(jù),非常適合處理海量數(shù)據(jù)??梢詫⑼瑫r段的各設(shè)備采集到的信號設(shè)計為二維矩陣,構(gòu)建成測量數(shù)據(jù)幀,再輸入CNN,從而有效實現(xiàn)故障診斷。同時,還可以利用非線性投影實現(xiàn)壓縮采集,處理海量數(shù)據(jù)。或者,將云計算與深度學(xué)習(xí)相結(jié)合,利用MapReduce框架,將海量故障數(shù)據(jù)進行切片處理,再輸入深度學(xué)習(xí)網(wǎng)絡(luò),進行大數(shù)據(jù)背景下的集成化裝備故障診斷。
集成化裝備由多個系統(tǒng)組成,每個系統(tǒng)又由不同的部件、元件組成,每一部分都可能發(fā)生故障,由于系統(tǒng)之間的密切聯(lián)系,故障也可能發(fā)生傳播,因此可能短時間內(nèi)同時發(fā)生多種故障,提高了診斷難度。
對于這個問題,可以將多堆棧膠囊設(shè)計為解耦分類器,實現(xiàn)復(fù)合故障的解耦。解耦分類器和Softmax分類器的主要區(qū)別在于分類器可以輸出的標簽數(shù)量。Softmax分類器只能輸出單個標簽,而解耦分類器可以輸出單個或多個標簽,從而能夠準確識別和分離復(fù)合故障。同時,增加故障樣本的種類也可以增多可以診斷出的故障類型。
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的層數(shù)、每層節(jié)點數(shù)等參數(shù)的設(shè)置,對于神經(jīng)網(wǎng)絡(luò)來說至關(guān)重要,而在這方面的研究很少,沒有一套系統(tǒng)的方法。
對于參數(shù)的初始化,大多數(shù)情況下都是通過前人的經(jīng)驗進行參數(shù)設(shè)置,或者通過初始化算法進行參數(shù)的隨機初始化,或者在實驗中調(diào)整參數(shù)、不斷嘗試。對于參數(shù)的優(yōu)化,可以采用網(wǎng)格搜索、隨機搜索算法、遺傳算法、粒子群算法、貝葉斯優(yōu)化算法、鯨魚算法等,隨著算法的發(fā)展,會出現(xiàn)更多新的算法,但使用時要注意平衡和訓(xùn)練時間之間的關(guān)系。
由于訓(xùn)練數(shù)據(jù)是在實驗環(huán)境下采集的,而裝備實際使用過程中可能受到多種噪聲干擾或硬件干擾,與實驗數(shù)據(jù)會有較大偏差,或者發(fā)生未知故障,在這種情況下,利用實驗數(shù)據(jù)訓(xùn)練的網(wǎng)絡(luò),對實際裝備進行故障診斷時很難獲得較好的效果。
為了解決噪聲干擾問題,可以使用基于去噪自編碼器的神經(jīng)網(wǎng)絡(luò),通過重構(gòu)含有噪聲的樣本,使模型具有更高的抗干擾性、魯棒性。為了解決實際數(shù)據(jù)與實驗數(shù)據(jù)來自不同分布的問題,可以將遷移學(xué)習(xí)與深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)相結(jié)合。遷移學(xué)習(xí)從源域中學(xué)習(xí),利用學(xué)到的知識解決目標域的問題,可以有效解決源數(shù)據(jù)與目標數(shù)據(jù)來自不同分布的情況下的故障診斷問題。
在實際應(yīng)用中,還有以下4種發(fā)展方向。
基于深度學(xué)習(xí)的故障診斷在機械等領(lǐng)域得到了廣泛應(yīng)用,如軸承、齒輪箱、電機等等,在這些機械中能夠通過傳感器等設(shè)備快速采集到信號,實現(xiàn)實時狀態(tài)監(jiān)測。但是裝備上其他單元可能需要使用示波器、頻譜儀等儀器,從電路板上的一些測量點獲取信號,而一些測量點的信號可能沒有被引出機箱,目前獲取信號還需要開箱檢測,難以實現(xiàn)實時的狀態(tài)監(jiān)測,為故障診斷帶來了不便,為了將基于深度學(xué)習(xí)的故障診斷應(yīng)用于更多領(lǐng)域,需要裝備在硬件上做出改變,將相應(yīng)測量點信號引出機箱。
目前集成化裝備已有狀態(tài)監(jiān)測系統(tǒng),能夠時刻監(jiān)測各部分狀態(tài),粗略判斷是否發(fā)生故障,但大部分系統(tǒng)卻不能判斷故障種類。而基于深度學(xué)習(xí)的故障診斷系統(tǒng)則能夠判斷出故障類型。因此,將基于深度學(xué)習(xí)的故障診斷系統(tǒng)與原有系統(tǒng)進行硬件或軟件上的結(jié)合,提高其兼容性,充分保留兩者的優(yōu)勢是一種發(fā)展方向。
基于深度學(xué)習(xí)的故障診斷能夠?qū)崿F(xiàn)精確的故障定位,將故障定位到板級、模塊級等等,但裝備系統(tǒng)龐大,需要分層進行故障診斷,先通過狀態(tài)監(jiān)測系統(tǒng)、專家經(jīng)驗等方式將故障定位到具體的單元,而后再利用深度學(xué)習(xí)進一步診斷故障。目前,狀態(tài)監(jiān)測系統(tǒng)已能實現(xiàn)粗略的故障定位,但還需維修人員再次明確,將故障定位到具體單元。對于這個步驟,廠家和維修人員根據(jù)診斷經(jīng)驗,從故障現(xiàn)象出發(fā),將診斷過程整理成詳細的診斷樹,維修人員按照診斷樹一步步排查即可將故障定位到具體的單元,既充分利用了專家經(jīng)驗,又減輕了診斷難度,維修人員只需掌握簡單的知識即可實現(xiàn)單元級的故障診斷。
現(xiàn)有的大部分研究僅停留在算法層面,而算法研究的最終目的是為了解決實際問題,因此,構(gòu)建嵌入式集成化裝備故障診斷系統(tǒng)是非常重要的。同時,嵌入式系統(tǒng)還可以增加系統(tǒng)的可移動性,系統(tǒng)出現(xiàn)問題可以快速更換。由于集成化裝備的結(jié)構(gòu)具有層次性,因此,需要針對不同系統(tǒng)、不同層次的特性,構(gòu)建嵌入式故障診斷系統(tǒng),通過采集到的信號直接判斷故障類型,高效完成故障診斷。
基于深度學(xué)習(xí)的集成化裝備故障診斷的最終目的是準確判斷裝備的狀態(tài),以確定裝備是否需要維修。與傳統(tǒng)方法相比,深度學(xué)習(xí)方法在故障診斷中有更高的準確率、更快的速度,因此,利用深度學(xué)習(xí)進行集成化裝備故障診斷是非常有意義的。本文首先總結(jié)了國內(nèi)外研究現(xiàn)狀,然后介紹了深度學(xué)習(xí)3種主要模型的基本理論,包括有效的方法和面對的問題,總結(jié)出故障診斷方法,最后指出了在集成化裝備故障診斷方面的挑戰(zhàn)與研究思路,并提出了在應(yīng)用中的發(fā)展方向。