王挺韶, 季天瑤, 姜雨滋, 王瑾
(華南理工大學(xué), 廣州 510640)
如今,人們對(duì)風(fēng)能的利用與日俱增,促使了風(fēng)力發(fā)電機(jī)的廣泛安裝。為了更好地利用風(fēng)力資源,風(fēng)力發(fā)電機(jī)通常安裝在風(fēng)力資源豐富的地區(qū)。然而,惡劣的工作環(huán)境增加了風(fēng)機(jī)各種故障的風(fēng)險(xiǎn),組件的振動(dòng)、腐蝕和溫度變化都會(huì)影響風(fēng)力發(fā)電機(jī)的發(fā)電能力,并可能導(dǎo)致電力系統(tǒng)的嚴(yán)重故障。與此同時(shí),對(duì)風(fēng)機(jī)進(jìn)行非計(jì)劃維護(hù)的代價(jià)高昂。為了降低這一成本,避免風(fēng)機(jī)潛在不可逆損害,一種有效的方法是盡早發(fā)現(xiàn)故障,這可以為主動(dòng)容錯(cuò)控制(Active Fault Tolerant Control,AFTC)系統(tǒng)提供重要的控制依據(jù),以保證風(fēng)電機(jī)組的可靠運(yùn)行。因此,采用先進(jìn)的風(fēng)機(jī)故障診斷與隔離(Fault Diagnosis and Isolation,F(xiàn)DI)方法也非常必要[1-3]。
風(fēng)機(jī)的故障診斷方法主要分為兩大類。一類是基于模型的方法,另一類是基于數(shù)據(jù)驅(qū)動(dòng)的方法?;谀P偷腇DI方法[4]研究風(fēng)機(jī)的物理特性,并建立數(shù)學(xué)模型,通過實(shí)際系統(tǒng)和正常系統(tǒng)的數(shù)學(xué)模型之間的差異來對(duì)故障進(jìn)行診斷。然而,由于風(fēng)力發(fā)電機(jī)組是一個(gè)復(fù)雜的系統(tǒng),很難對(duì)風(fēng)力發(fā)電機(jī)組進(jìn)行精確的數(shù)學(xué)描述,所以很難避免模型與實(shí)際情況的不匹配。此外,不確定性的干擾,如測(cè)量,噪音等隨機(jī)因素對(duì)殘差的評(píng)估和決策也帶來負(fù)面影響。這些不可避免的缺點(diǎn)限制了大多數(shù)基于模型的方法在實(shí)際應(yīng)用中的有效性?;跀?shù)據(jù)驅(qū)動(dòng)的故障診斷方法[5-6]在近幾年也得到廣泛的發(fā)展,主要可分為基于機(jī)器學(xué)習(xí)的方法與基于神經(jīng)網(wǎng)絡(luò)的方法。基于機(jī)器學(xué)習(xí)的方法,需要對(duì)原始信號(hào)處理進(jìn)行處理,如將信號(hào)進(jìn)行小波分解或者經(jīng)驗(yàn)?zāi)B(tài)分解,再將分解的特征作為機(jī)器學(xué)習(xí)模型的訓(xùn)練數(shù)據(jù)進(jìn)行分類。基于神經(jīng)網(wǎng)絡(luò)的方法,如基于深度置信網(wǎng)絡(luò)(Deep Belief Networks,DBN)的診斷方法可以不用對(duì)數(shù)據(jù)進(jìn)行特征處理,借助神經(jīng)網(wǎng)絡(luò)本身能對(duì)數(shù)據(jù)進(jìn)行特征學(xué)習(xí)的能力,實(shí)現(xiàn)故障診斷。然而DBN方法沒有充分利用數(shù)據(jù)的時(shí)序特征,在噪聲下的表現(xiàn)仍有待提高。為此,提出一種基于一維卷積網(wǎng)絡(luò)(1-Dimension Convolutional Network, Conv1d)與自動(dòng)降噪編碼器[7](Denoise Auto Encoder Decoder, DAE)相結(jié)合的數(shù)據(jù)驅(qū)動(dòng)故障診斷模型。
為了驗(yàn)證模型的性能,首先使用基準(zhǔn)風(fēng)機(jī)模型產(chǎn)生仿真數(shù)據(jù),并在獲得仿真數(shù)據(jù)的基礎(chǔ)上,與基于模型的方法進(jìn)行了對(duì)比,基于模型的對(duì)比算法包括估算法[8](Estimation-Based Solution,EB)、一般故障模型法(General Fault Model Solution,GFM)、可逆計(jì)數(shù)器法[9](Up-Down Counter Solution,UDC)和觀測(cè)器與卡爾曼濾波器相結(jié)合法[10](Combined Observer and Kalman Filter Solution,COK)。同時(shí)也和其他數(shù)據(jù)驅(qū)動(dòng)方法進(jìn)行了對(duì)比,主要包括DBN、隨機(jī)森林算法[11](Random Forest, RF)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long-Short Time Memory Networks, LSTM)。實(shí)驗(yàn)結(jié)果表明,文中模型在準(zhǔn)確度、魯棒性和速度上都具有很好的表現(xiàn)。
出于研究的需要,文獻(xiàn)[1]提出了一個(gè)風(fēng)機(jī)基準(zhǔn)模型,該模型已經(jīng)得到相關(guān)研究人員的廣泛認(rèn)可,其組成如圖1所示。
圖1 基準(zhǔn) 風(fēng)機(jī)模型
由圖1可知,基準(zhǔn)風(fēng)機(jī)模型由四個(gè)子系統(tǒng)組成[12]。其中,槳距系統(tǒng)是風(fēng)機(jī)控制槳距的核心系統(tǒng),通過控制槳距角實(shí)現(xiàn)對(duì)功率的控制;傳動(dòng)系統(tǒng)負(fù)責(zé)將葉片轉(zhuǎn)動(dòng)產(chǎn)生的機(jī)械能傳遞到發(fā)電機(jī)端,起到能量傳遞的作用;控制器既能控制槳距系統(tǒng),又能控制發(fā)電機(jī),因此能根據(jù)風(fēng)速來調(diào)節(jié)風(fēng)機(jī)的功率。發(fā)電機(jī)與變頻器模塊則是負(fù)責(zé)將機(jī)械能轉(zhuǎn)換成電能,并控制電能頻率的模塊。上述各個(gè)模塊中狀態(tài)量的物理意義見表1。
表1 風(fēng)機(jī)變量概述
在Simulink仿真系統(tǒng)上建立上述風(fēng)機(jī)基準(zhǔn)模型,并通過傳感器收集這些數(shù)據(jù),隨后通過卷積神經(jīng)網(wǎng)絡(luò)來提取傳感器數(shù)據(jù)的時(shí)序特征,從而挖掘傳感器數(shù)據(jù)與故障之間的關(guān)系,實(shí)現(xiàn)對(duì)故障的有效診斷。
仿真設(shè)置主要參考了文獻(xiàn)[5]的設(shè)置,并著重與文獻(xiàn)[5]進(jìn)行了對(duì)比。在文獻(xiàn)[5]中,設(shè)置了三大類故障,總計(jì)9種故障類型。所有的故障均為微小故障,分別為:傳感器故障、執(zhí)行器故障、系統(tǒng)故障。三種故障類型的數(shù)量分別為5種、 3種、 1種。具體的設(shè)置見表2。
表2 故障的設(shè)置與概述
在故障數(shù)據(jù)采集中,仿真時(shí)間為4 400 s,每一種故障的持續(xù)時(shí)間為100 s,在故障發(fā)生區(qū)間的選擇上,為了充分模擬現(xiàn)實(shí)條件下故障發(fā)生的情況,將故障發(fā)生的區(qū)間盡可能分散到仿真的區(qū)間中,盡量減少因?yàn)楣收蠀^(qū)間設(shè)置不合理導(dǎo)致的實(shí)驗(yàn)結(jié)果偏差。為此,在仿真過程中將9個(gè)故障的設(shè)置集中在不同的區(qū)間。選取了等分的區(qū)間: [0, 2 000]、[1 000, 3 000]、 [2 000, 4 000]和[3 000, 4 400],在此基礎(chǔ)上,將9個(gè)故障分散在區(qū)間[0, 4 400]中,因此將獲得5個(gè)故障數(shù)據(jù)集。由于是對(duì)單個(gè)傳感器故障進(jìn)行識(shí)別,在每個(gè)故障數(shù)據(jù)集中,傳感器故障區(qū)間將不會(huì)重疊,保證了每一時(shí)刻最多只有一種故障發(fā)生。最后的實(shí)驗(yàn)結(jié)果,是這5組數(shù)據(jù)得到的結(jié)果的平均值。
選用了風(fēng)力發(fā)電機(jī)中所有與表2有關(guān)的傳感器數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。這些數(shù)據(jù)可以表示為多變量的時(shí)序數(shù)據(jù):
(1)
(2)
(3)
在對(duì)數(shù)據(jù)進(jìn)行歸一化后,還需要將這些數(shù)據(jù)按照相同的時(shí)間聚合起來,由于傳感器總共15個(gè),因此特征維度為15。同時(shí),還需要對(duì)數(shù)據(jù)進(jìn)行滑動(dòng)窗口大小的選擇并確定序列的長(zhǎng)度。數(shù)據(jù)采樣頻率為100 Hz,在滑動(dòng)窗口和序列長(zhǎng)度的選擇上,選擇了使用5 000個(gè)樣本的少量數(shù)據(jù)集進(jìn)行初步訓(xùn)練,從而確定序列長(zhǎng)度與滑動(dòng)窗口的大小。初步訓(xùn)練的數(shù)據(jù)集規(guī)模極小,網(wǎng)絡(luò)的模型較為簡(jiǎn)單,僅為一層一維卷積網(wǎng)絡(luò)和全連接層,訓(xùn)練的結(jié)果僅供滑動(dòng)窗口大小和序列長(zhǎng)度的選擇提供參考。在試驗(yàn)的過程中,分別選取了32、50、64、128幀的序列,以及5、10、20幀的滑動(dòng)窗口長(zhǎng)度,兩兩組合,構(gòu)建訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練。在經(jīng)過短暫的訓(xùn)練后,發(fā)現(xiàn)50為合適的序列長(zhǎng)度,滑動(dòng)窗口k合適長(zhǎng)度為5。最終的訓(xùn)練集S*可以表示為:
(4)
(5)
式中k為滑動(dòng)窗口長(zhǎng)度,k=5m-4,m∈+。
原始的自動(dòng)編碼器(Auto Encoder Decoder, AE)是一種簡(jiǎn)單的由兩層全連接層構(gòu)成的前饋神經(jīng)網(wǎng)絡(luò)[13]。這兩層網(wǎng)絡(luò)分別對(duì)應(yīng)了編碼器和解碼器。自動(dòng)編碼器被用于對(duì)原始數(shù)據(jù)進(jìn)行降維,通過將編碼器的輸出向量限制在較小的維度,可以將原始的稀疏數(shù)據(jù)嵌入到更小維度的空間當(dāng)中,從而實(shí)現(xiàn)數(shù)據(jù)的降維。而解碼器的功能對(duì)應(yīng)著將低維空間的特征數(shù)據(jù)還原為原始信號(hào),實(shí)現(xiàn)對(duì)信號(hào)的重構(gòu)。
圖2 降噪自動(dòng)編碼器原理
其中h為低維特征空間,在神經(jīng)網(wǎng)絡(luò)中是一個(gè)經(jīng)過訓(xùn)練的隱藏層??梢员硎緸椋?/p>
(6)
式中sigmoid為激活函數(shù);W,b分別為編碼器的權(quán)重和偏置。因此,針對(duì)一個(gè)信號(hào),可以對(duì)其加入高斯噪聲,并以原始信號(hào)為目標(biāo)進(jìn)行訓(xùn)練,從而可以得到一個(gè)能表征該數(shù)據(jù)特征的網(wǎng)絡(luò)。這層網(wǎng)絡(luò)能對(duì)噪聲信號(hào)進(jìn)行重構(gòu),實(shí)現(xiàn)濾波的功能。濾波的過程也是神經(jīng)網(wǎng)絡(luò)前向計(jì)算的過程:
x=sigmoid(W′h+b′)
(7)
式中W′和b′分別為解碼器的權(quán)重和偏置。文章基于降噪自動(dòng)編碼器,針對(duì)每個(gè)故障信號(hào)訓(xùn)練了一個(gè)對(duì)應(yīng)的降噪自動(dòng)編碼器,在訓(xùn)練自動(dòng)降噪編碼器的過程中,對(duì)原始信號(hào)加入20 dB的高斯噪聲,并對(duì)傳感器數(shù)據(jù)進(jìn)行逐個(gè)訓(xùn)練,分別得到與傳感器數(shù)據(jù)對(duì)應(yīng)的降噪編碼器。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,一般指二維卷積核(Conv2d),常用于圖像的識(shí)別[15-16],該卷積核接受一個(gè)二維輸入,表示圖像的長(zhǎng)與寬,在圖像上長(zhǎng)寬兩個(gè)維度上進(jìn)行卷積的過程則稱為特征學(xué)習(xí)。
同樣的過程也適用于一維數(shù)據(jù)。對(duì)一維序列進(jìn)行卷積從序列數(shù)據(jù)中提取特征并映射序列的內(nèi)部特征。一維卷積對(duì)于從整個(gè)數(shù)據(jù)集的定長(zhǎng)段中提取特征是非常有效的,得益于最大池化層,一維卷積對(duì)序列中特征的位置并不敏感,非常適合對(duì)發(fā)生在不同時(shí)刻的故障進(jìn)行特征提取。
基于一維卷積核的時(shí)間序列特征提取的原理如圖3所示,由于要充分提取序列的特征,可以設(shè)置多個(gè)卷積核進(jìn)行卷積運(yùn)算,從而提取不同時(shí)間尺度的特征。對(duì)于第k個(gè)卷積核,卷積計(jì)算為:
(8)
(9)
圖3 卷積核提取時(shí)序特征過程
在卷積層進(jìn)行卷積之后,加入最大池化層(Max Pooling Layer),最大池化層的作用是對(duì)卷積進(jìn)行降采樣的操作。在降采樣的區(qū)域內(nèi),最大值將保留,而在區(qū)域內(nèi)的其他值將設(shè)為0。當(dāng)卷積核過多時(shí),雖然能提取更多的特征,但同時(shí)隱藏層的層數(shù)會(huì)增加,也會(huì)產(chǎn)生大量的與特征無關(guān)的數(shù)據(jù)。為了減少其他數(shù)據(jù)對(duì)特征的影響,同時(shí)減少計(jì)算的復(fù)雜度,在卷積層后加入最大池化層是十分必要的操作。
將風(fēng)機(jī)的故障診斷作為一個(gè)深度學(xué)習(xí)分類任務(wù)[17]。分類任務(wù)作為經(jīng)典的監(jiān)督式學(xué)習(xí),需要對(duì)9類故障的類別進(jìn)行標(biāo)簽化處理。使用了獨(dú)熱編碼對(duì)標(biāo)簽數(shù)據(jù)進(jìn)行編碼。對(duì)于維度為1*9的標(biāo)簽Li,其故障類別為k,則第k個(gè)元素值為1,而其他元素值為0。引入獨(dú)熱編碼解決了由于分類數(shù)據(jù)在數(shù)值上的設(shè)置不合理而導(dǎo)致的類別不均衡的問題,對(duì)于故障類別的診斷有著很好的效果。
同時(shí)采用了分類交叉熵(Categorical Cross Entropy, CCE)作為模型的損失函數(shù)。分類交叉熵的定義為:
(10)
式中C為所有故障類別;ti為類別i的概率;f(s)i為網(wǎng)絡(luò)對(duì)于樣本s預(yù)測(cè)其為類別i的值,當(dāng)使用softmax作為激活函數(shù)時(shí),f(s)i為:
(11)
為了解決模型的泛化性不強(qiáng)的問題,使用了L1正則化作為正則化項(xiàng),加入L1正則化的損失函數(shù)可以表示為:
(12)
式中ω為網(wǎng)絡(luò)中所有的權(quán)重,λ為超參數(shù),用于控制模型的復(fù)雜度。同時(shí),在卷積網(wǎng)絡(luò)層與池化層之后加入了Dropout層,Dropout層的作用是以一定的概率將神經(jīng)元的權(quán)重置為0來模擬外界擾動(dòng)對(duì)網(wǎng)絡(luò)帶來的影響,從而起到了提高泛化性能的作用。雖然z正則化與Dropout兩種方法都用于改進(jìn)模型的泛化性能,但這兩種方法在本質(zhì)上仍存在區(qū)別。L1正則化是對(duì)整個(gè)模型的參數(shù)進(jìn)行調(diào)節(jié)的手段,起到降低模型復(fù)雜度的作用。而Dropout則是給模型特定的一層帶來隨機(jī)擾動(dòng),提高該層網(wǎng)絡(luò)抗干擾的能力,因此僅影響模型的一層網(wǎng)絡(luò)。
通過上述建模并從理論上分析,得到文中模型具有以下優(yōu)勢(shì),使得其更加適用于風(fēng)機(jī)故障診斷這一應(yīng)用:
(1)傳統(tǒng)的基于模型的方法需要對(duì)不同的風(fēng)機(jī)模型進(jìn)行物理特性分析,對(duì)于不同的故障也需要建立不同的數(shù)學(xué)模型,比較費(fèi)時(shí)費(fèi)力。而與傳統(tǒng)的基于模型方法相比,基于dAE-Conv1d的神經(jīng)網(wǎng)絡(luò)框架僅僅依靠檢測(cè)數(shù)據(jù),減少了建模的工作量,具有普適性。同時(shí),由于一維卷積通過設(shè)定卷積核的大小,從而能在時(shí)序數(shù)據(jù)上提取多種特征,因此能夠構(gòu)建同時(shí)識(shí)別多種故障的多分類的神經(jīng)網(wǎng)絡(luò)模型,并行的識(shí)別過程大大減少了診斷時(shí)間。實(shí)驗(yàn)中,使用了15種時(shí)序數(shù)據(jù)來對(duì)9種特征進(jìn)行分類。但一維卷積神經(jīng)網(wǎng)絡(luò)的性能還有待挖掘,還能進(jìn)行更多特征,更多故障類型的識(shí)別。因此在診斷的速度和精度上所提網(wǎng)絡(luò)都比基于模型的方法優(yōu)異;
(2)與傳統(tǒng)的機(jī)器學(xué)習(xí)模型相比,所提出的模型也具有諸多優(yōu)勢(shì)。傳統(tǒng)機(jī)器學(xué)習(xí)模型,如支持向量機(jī)、隨機(jī)森林等,需要進(jìn)行數(shù)據(jù)特征特構(gòu)建。特征工程的建立也是一個(gè)難度較高的過程。而所提模型基于一維卷積神經(jīng)網(wǎng)絡(luò),其能提取時(shí)序特征的特性減少了前期的特征工作,只需要進(jìn)行網(wǎng)絡(luò)參數(shù)的調(diào)整和訓(xùn)練數(shù)據(jù)集的重構(gòu),則能適應(yīng)不同的傳感器數(shù)據(jù)、不同故障類型的診斷場(chǎng)景。同時(shí)在訓(xùn)練速度上,文中模型也比隨機(jī)森林等傳統(tǒng)的機(jī)器學(xué)習(xí)算法有優(yōu)勢(shì),能處理更大更復(fù)雜的數(shù)據(jù)集,并在性能上不會(huì)下降;
(3)與其他神經(jīng)網(wǎng)絡(luò)模型相比,文中模型也有優(yōu)勢(shì)。主要體現(xiàn)在對(duì)噪聲的敏感度上,所提模型由于加入了降噪自動(dòng)編碼器,使得模型在噪聲環(huán)境下也能保持良好的性能。同時(shí)與深度置信網(wǎng)絡(luò)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)相比,一維卷積網(wǎng)絡(luò)的訓(xùn)練時(shí)間更短。深度置信網(wǎng)絡(luò)在更新參數(shù)時(shí)需要進(jìn)行貪心搜索,使得參數(shù)更新相對(duì)緩慢。至于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò),參數(shù)眾多,難以調(diào)節(jié),訓(xùn)練速度更加緩慢。同時(shí),上述兩種神經(jīng)網(wǎng)絡(luò)在性能上與所提模型相比也沒有優(yōu)勢(shì);
(4)自動(dòng)降噪編碼器實(shí)質(zhì)上是神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)特征的充分學(xué)習(xí),訓(xùn)練后的網(wǎng)絡(luò)能對(duì)給定的信號(hào)進(jìn)行降噪和還原,且不依賴于硬件和特定的信號(hào)處理方法,只需要將訓(xùn)練的模型數(shù)據(jù)部署到服務(wù)器上,就能實(shí)現(xiàn)對(duì)信號(hào)的還原,具有較高的實(shí)用性。
在模型的驗(yàn)證方面,主要選擇了三個(gè)方面對(duì)模型的性能進(jìn)行驗(yàn)證,包括:在相同故障下與基于模型和基于機(jī)器學(xué)習(xí)診斷方法的對(duì)比,并著重與DBN算法進(jìn)行了對(duì)比;驗(yàn)證模型在噪聲條件下的性能;驗(yàn)證模型的診斷速度。
在第一個(gè)對(duì)比實(shí)驗(yàn)中,數(shù)據(jù)為無噪聲數(shù)據(jù),因此沒有使用自動(dòng)降噪編碼器對(duì)數(shù)據(jù)進(jìn)行降噪,而在第二個(gè)實(shí)驗(yàn)中,則使用了降噪編碼器。
具體的評(píng)價(jià)指標(biāo)為精度(Precision, Prec)、召回率(Recall, Reca)和F1值(F1-Score, F1)。評(píng)價(jià)指標(biāo)的具體定義如下:
(13)
(14)
(15)
式中TP為真陽(yáng)率,表示對(duì)正樣本預(yù)測(cè)為正的比值;FP為假陽(yáng)率,即對(duì)于負(fù)樣本,預(yù)測(cè)為正比值;FN為假陰率,表示對(duì)于正樣本預(yù)測(cè)為假的值。為了與其他模型進(jìn)行對(duì)比,選用漏檢率(Miss Detect Rate, MRD)來代替召回率,作為檢驗(yàn)?zāi)P挽`敏度的標(biāo)準(zhǔn)。漏檢率與召回率的關(guān)系為:
(16)
選用EB、UDC、GFM方法與文中的模型進(jìn)行對(duì)比,由于基于模型的方法不能檢測(cè)系統(tǒng)故障,因此僅對(duì)前8個(gè)故障進(jìn)行了診斷。模型對(duì)比驗(yàn)證的結(jié)果見表3。
表3 本模型與基于模型診斷方法對(duì)比
由表3結(jié)果可知,文中模型與其他三個(gè)基于模型的算法相比,在性能上處于明顯的優(yōu)勢(shì),即便在個(gè)別故障中的個(gè)別指標(biāo)不如某個(gè)模型檢測(cè)方法,如故障2中的UDC算法的準(zhǔn)確率高于文中模型,但該算法在漏檢率和F1值的表現(xiàn)上遠(yuǎn)差于所提算法??梢钥闯?,文中模型在診斷的準(zhǔn)確度上遠(yuǎn)優(yōu)于基于模型的方法,特別是在平均漏檢率和平均F1值上優(yōu)勢(shì)明顯。
在與基于模型方法比較的同時(shí),也與其他機(jī)器學(xué)習(xí)模型進(jìn)行了比對(duì),著重對(duì)比了DBN與LSTM網(wǎng)絡(luò)。其中,LSTM的架構(gòu)類似所用模型,僅用門控循環(huán)單元(Gate Recurrent Unit,GRU)來替換卷積神經(jīng)網(wǎng)絡(luò)層,并移除掉最大池化層。同時(shí),還使用了隨機(jī)森林(Random Forest, RF)作為對(duì)比,結(jié)果如表4所示。
表4 本模型與基于數(shù)據(jù)驅(qū)動(dòng)方法對(duì)比
由表4可知,文中模型在性能上優(yōu)于其他機(jī)器學(xué)習(xí)模型。與DBN相比,在無噪聲條件下本模型的每個(gè)指標(biāo)都優(yōu)于DBN。而傳統(tǒng)的時(shí)序神經(jīng)網(wǎng)絡(luò)LSTM,在識(shí)別這些故障時(shí)雖然也有較好的效果,但訓(xùn)練的時(shí)間過長(zhǎng),不適合在生產(chǎn)環(huán)境中應(yīng)用。同時(shí),結(jié)合表3與表4的結(jié)果可以知道,基于數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法在平均性能上要優(yōu)于基于模型的方法。這時(shí)由于基于模型的方法僅針對(duì)個(gè)別故障,因此在診斷結(jié)果上,會(huì)出現(xiàn)對(duì)部分故障診斷結(jié)果十分準(zhǔn)確,而對(duì)于個(gè)別故障,則幾乎不能實(shí)現(xiàn)有效診斷的情況,這也是基于模型的診斷方法存在的缺點(diǎn)。而對(duì)于數(shù)據(jù)驅(qū)動(dòng)的模型,在有大量有效數(shù)據(jù)的前提下,都能對(duì)相應(yīng)的故障類型做出準(zhǔn)確判斷。但這些數(shù)據(jù)驅(qū)動(dòng)的模型都需要足夠多的數(shù)據(jù)來支撐模型的性能,這也是數(shù)據(jù)驅(qū)動(dòng)模型的不足之處。
綜合以上實(shí)驗(yàn)可以發(fā)現(xiàn),在無噪環(huán)境下,DBN的性能雖然稍落后于本模型,但也能實(shí)現(xiàn)較高準(zhǔn)確度的診斷。而本模型的性能優(yōu)于所有參與對(duì)比的其他模型。因此,為了進(jìn)一步比較文中模型與DBN之間的性能差異,在此基礎(chǔ)上對(duì)文中模型與DBN進(jìn)行魯棒性檢驗(yàn)。
在魯棒性校驗(yàn)中,分別向故障數(shù)據(jù)加入35 dB、30 dB、25 dB、20 dB、15 dB、10 dB、5 dB的高斯噪聲,使用三組模型進(jìn)行5次實(shí)驗(yàn),并以平均F1值為最終的指標(biāo)來進(jìn)行比對(duì)。三組模型分別為:Conv1d、dAE+Conv1d和DBN。最終的比對(duì)結(jié)果如圖4所示。
圖4 文中模型與DBN魯棒性對(duì)比
由魯棒性校驗(yàn)的結(jié)果可以得知,文中模型在噪聲條件下的性能要明顯由于DBN。雖然DBN在低噪聲下還能保持定的準(zhǔn)確度,但其性能在信噪比為30 dB時(shí)就出現(xiàn)了明顯的下降。而加入了降噪自動(dòng)編碼器的文中模型在信噪比為5 dB時(shí)F1值仍然可以保持在0.9左右,這說明本模型具有很強(qiáng)的魯棒性。
在網(wǎng)絡(luò)模型已經(jīng)訓(xùn)練好的前提下,進(jìn)行了模型診斷時(shí)間的驗(yàn)證。由于網(wǎng)絡(luò)訓(xùn)練結(jié)束后其結(jié)果以h5文件格式保存于本地硬盤中,在診斷開始時(shí),需要進(jìn)行模型的加載,加載的過程需要耗費(fèi)一定的時(shí)間。因此,診斷過程可以簡(jiǎn)要?jiǎng)澐譃椋杭虞d自動(dòng)降噪編碼器模型;加載卷積神經(jīng)網(wǎng)絡(luò)模型;信號(hào)降噪;故障診斷。使用17 000條故障數(shù)據(jù)作為輸入,將模型加載的時(shí)間和診斷時(shí)間考慮在內(nèi),在進(jìn)行5次實(shí)驗(yàn)后,記錄平均的診斷時(shí)間,診斷時(shí)間為降噪時(shí)間與故障診斷時(shí)間的和,結(jié)果見表5。
表5 文中模型診斷速度
雖然模型加載時(shí)間稍長(zhǎng),總共消耗9 s, 但由于模型只需要加載一次,之后的診斷將不會(huì)進(jìn)行模型的加載,因此不會(huì)對(duì)故障診斷的耗時(shí)造成太大影響。而降噪編碼器要對(duì)每一個(gè)信號(hào)進(jìn)行一次降噪,耗費(fèi)時(shí)間稍長(zhǎng),導(dǎo)致平均診斷時(shí)間相較于無降噪時(shí)有明顯提高,但考慮到降噪環(huán)節(jié)對(duì)診斷的結(jié)果有明顯的提升,因此時(shí)間消耗的小幅提高也在接受的范圍之內(nèi)。
為了挖掘風(fēng)機(jī)在發(fā)生故障時(shí)其傳感器數(shù)據(jù)的時(shí)序特征,實(shí)現(xiàn)在數(shù)據(jù)驅(qū)動(dòng)下對(duì)風(fēng)機(jī)故障的診斷。提出了一種基于降噪自編碼器和一維卷積神經(jīng)網(wǎng)絡(luò)的故障診斷模型。對(duì)于所有傳感器的時(shí)序數(shù)據(jù),構(gòu)建一維卷積層對(duì)多個(gè)特征進(jìn)行并行提取,并使用全連接層處理提取出來的特征,實(shí)現(xiàn)對(duì)故障的診斷。相比于基于模型的方法只能在個(gè)別故障上進(jìn)行識(shí)別,文中模型對(duì)于設(shè)定的故障,都有十分優(yōu)異的表現(xiàn),同時(shí)在精度與魯棒性上也全面超過了深度置信網(wǎng)絡(luò)。然而,由于只關(guān)注于單個(gè)故障,在設(shè)置故障時(shí)沒有考慮可能同時(shí)發(fā)生的多個(gè)故障,因此,后續(xù)將繼續(xù)研究基準(zhǔn)風(fēng)機(jī)型,構(gòu)建更加復(fù)雜的故障數(shù)據(jù),并研究基于數(shù)據(jù)驅(qū)動(dòng)的故障多分類問題。