劉琦昊, 許盛之, 俞梅, 趙二剛, 楊松澤, 張建軍*
(1.南開大學電子信息與光學工程學院電子科學與工程系, 天津 300350; 2.天津市光電子薄膜器件與技術重點實驗室, 天津 300071; 3.薄膜光電子技術教育部工程研究中心, 天津 300350)
三相異步電機是廣泛應用于當代社會工業(yè)生產(chǎn)中的重要驅(qū)動設備,對于其故障診斷的研究具有重要的現(xiàn)實意義[1]。其結(jié)構(gòu)復雜,且故障與特征之間存在非線性關系,使故障診斷的難度也大大增加[2]。
實際生產(chǎn)中異步三相電機常用的故障診斷方法有兩種,定子電流分析法和振動信號分析法。電流分析法一般通過測量電機的電壓電流參數(shù)進行分析診斷;震動分析法一般通過安裝加速度計測量電機的振動信號。這兩種方法在收集數(shù)據(jù)時將傳感器安裝在電機上,是基于“侵入式”的采集。由于實際的生產(chǎn)條件與環(huán)境限制,在每個設備上安裝傳感器獲得數(shù)據(jù)的傳統(tǒng)方法雖然較為準確可靠,但維護不便,具有一定的局限性。
收集到數(shù)據(jù)后,傳統(tǒng)方法采用人工處理數(shù)據(jù)并建模,這需要豐富的先驗知識和經(jīng)驗作為支撐,且人工提取特征難度較大且模型精度不足[3-4]。而基于神經(jīng)網(wǎng)絡的方法由網(wǎng)絡替代人工提取深度特征,尤其是在數(shù)量龐大、來源豐富和維度較高的測量數(shù)據(jù)中提取特征,以進行模型訓練及泛化,降低工作難度的同時提高診斷精度[5-6],因此神經(jīng)網(wǎng)絡被廣泛應用于設備故障診斷領域[7-9]。
近年來,基于卷積神經(jīng)網(wǎng)絡的故障檢測方法研究已經(jīng)興起,由于卷積神經(jīng)網(wǎng)絡在圖像領域應用最為廣泛[10],因此許多研究人員采用原始卷積網(wǎng)絡結(jié)構(gòu),構(gòu)造二維圖像數(shù)據(jù)集進行診斷。Zhao等[7]對振動信號進行傅里葉變換,獲取二維頻譜信號進行網(wǎng)絡訓練,實現(xiàn)旋轉(zhuǎn)機械狀態(tài)監(jiān)測。王麗華等[1]使用短時傅里葉變換,提取時頻譜圖進行網(wǎng)絡訓練,實現(xiàn)異步電機故障診斷。Chen等[8]通過繪制振動信號的特征統(tǒng)計圖,進行網(wǎng)絡訓練,實現(xiàn)故障分類。韓濤等[11]提取出信號多的小波系數(shù)圖和時頻圖進行網(wǎng)絡訓練,診斷故障。Ding等[12]使用小波包能量圖像進行網(wǎng)絡訓練,診斷故障。這些基于卷積神經(jīng)網(wǎng)絡的方法都取得了不錯的模型精確度,但是由于網(wǎng)絡模型限制,仍需要人為提取特征并處理為二維圖像后才能訓練網(wǎng)絡[13]。
此外,郇嘉嘉等[14]提出了一種基于彩色圖像編碼與深度學習的電力負荷識別方法;王守相等[15]提出了基于特征融合與神經(jīng)網(wǎng)絡的負荷識別方法,在基于神經(jīng)網(wǎng)絡實現(xiàn)非侵入式負荷監(jiān)測的領域,都取得了較高的準確率。相較于侵入式負荷監(jiān)測系統(tǒng)而言,非侵入式監(jiān)測在保證結(jié)果的前提下,大大減少了安裝維護的成本,具有很大優(yōu)勢。
基于此,現(xiàn)提出一種基于卷積網(wǎng)絡的非侵入式故障檢測方法。測量電機與其他設備共同工作時的總電流電壓信號片段,構(gòu)建大量表示不同故障的帶標簽樣本數(shù)據(jù),實現(xiàn)非侵入式監(jiān)測;并設計一種新型一維卷積神經(jīng)網(wǎng)絡結(jié)構(gòu),利用殘差反向傳播算法,經(jīng)過多次迭代自動提取特征,使網(wǎng)絡適用于非侵入式采集到的數(shù)據(jù),無需人工提取任何特征,建立起總電源信號與電機運行情況的聯(lián)系,以期實現(xiàn)電機故障的非侵入式精確判斷[16]。
基于卷積神經(jīng)網(wǎng)絡的非侵入式故障診斷方法的框圖如圖1所示,分為數(shù)據(jù)采集預處理、神經(jīng)網(wǎng)絡訓練、故障診斷三部分。首先進行非侵入式采集,即只采集總電源數(shù)據(jù),并對其進行歸一化等預處理,劃分為訓練集與測試集;其次將訓練集輸入改進后的神經(jīng)網(wǎng)絡進行訓練,網(wǎng)絡進行多次迭代以優(yōu)化參數(shù),直至達到規(guī)定的迭代次數(shù)為止;最后將測試集數(shù)據(jù)輸入訓練好的網(wǎng)絡得到診斷結(jié)果,實現(xiàn)電機故障檢測。
圖1 基于神經(jīng)網(wǎng)絡的非侵入式檢測流程圖Fig.1 Flow chart of non-invasive detection based on neural network
非侵入式負荷監(jiān)測(non-intrusive load monitoring, NILM)是一種在獲取總負荷電壓電流等電力信息的情況下,分解并識別其中單個電器的方法,最早用于家用電器的工作狀態(tài)識別[17]。
非侵入式負荷監(jiān)測系統(tǒng)是在侵入式負荷監(jiān)測系統(tǒng)的發(fā)展進入瓶頸后提出的一種新型電力負荷監(jiān)測技術,只需要在用戶的總線處安裝監(jiān)測設備,通過對用戶電力入口處的電壓、電流等信息進行采集,分解出該用戶實時使用中的各類負荷的使用情況及工作狀態(tài),不需要侵入用戶家庭的用電系統(tǒng)中。
將其應用到電機故障檢測領域,以滿足節(jié)能與優(yōu)化成本等需要。
根據(jù)實際工況,設計一個三相異步電機與其他生產(chǎn)設備共同工作的電路采集模型,在總電源處進行采集,如圖2所示。
圖2 非侵入式采集示意圖Fig.2 Schematic diagram of non-invasive collection
建立鼠籠型三相異步電機仿真模型,其在dq坐標系下的標量表達式[18]為
(1)
式(1)中:usd、usq和urd、urq分別為定子和轉(zhuǎn)子電壓;isd、isq和ird、irq為定子、轉(zhuǎn)子電流;ψsd和ψsq為定子磁鏈;ψrd和ψrq為轉(zhuǎn)子磁鏈;Rs和Rr為定子與轉(zhuǎn)子電阻;Ls和Lr為定子與轉(zhuǎn)子電感;Lm為定轉(zhuǎn)子互感;ωm為同步轉(zhuǎn)速;ωs為機械轉(zhuǎn)速;t為時間。其等效電路圖如圖3所示。
為定子電壓;和分別為定子、轉(zhuǎn)子電流;Lsσ和Ltσ為定子、 轉(zhuǎn)子漏感;UΨI為定轉(zhuǎn)子激磁電壓;為勵磁電流圖3 三相異步電機等效電路圖Fig.3 Equivalent circuit diagram of three-phase asynchronousmotor
實驗采集電機在正常工作、超載、單相短路及相間短路故障情況下的總電流電壓特征參數(shù),以進行非侵入式的神經(jīng)網(wǎng)絡故障診斷,其中單相短路與相間短路分別包含3種短路方式,共8種故障分類。
非侵入式采集模型在總電源處進行三相電壓電流數(shù)據(jù)采集。以滑動窗口的形式,即以0.02 s為截取長度,以采樣頻率為滑動速度,依時間方向依次移動截取數(shù)據(jù),將截到的一個電網(wǎng)周期內(nèi)電流電壓散點數(shù)據(jù)作為一條樣本[19]。由于電機在工作時,單相電流瞬時值一般不足2 A,而其單相電壓瞬時值可以接近380 V,數(shù)值相差較大,因此需要對采集到的數(shù)據(jù)進行歸一化處理,使其全部映射在0~1,便于比較與加權(quán),歸一化過程為
(2)
式(2)中:x為某條樣本的電流或電壓值;x_min與x_max為樣本中電流或電壓的最小值與最大值;x′為歸一化后的結(jié)果。將處理后的電流與電壓樣本按A相-B相-C相的順序拼接成一條數(shù)據(jù),以供網(wǎng)絡訓練,并建立故障標簽與數(shù)據(jù)一一對應,形成數(shù)據(jù)集,該數(shù)據(jù)集囊括8種不同的故障情況。
卷積神經(jīng)網(wǎng)絡(convolutional neural networks, CNN)是一種具有交替卷積和二次采樣層的前饋與約束神經(jīng)網(wǎng)絡,通常由卷積層、池化層、全連接層組成。CNN對輸入信號進行由淺層至深層的特征提取,使用反向傳播算法進行訓練,最終輸出分類結(jié)果,是一種應用廣泛的深度學習結(jié)構(gòu)[20]。
卷積層都由多個卷積核組成,每個卷積核的參數(shù)都是由反向傳播算法得到的最佳結(jié)果。隨著卷積層數(shù)增加,可以提取到的特征復雜程度也越來越多[21]。
池化是一種實現(xiàn)降采樣功能的運算,將反向傳播過程中的梯度取最大值或平均值,以減少參數(shù)量。
在卷積神經(jīng)網(wǎng)絡中,經(jīng)過多個卷積與池化層之后,會連接著全連接層,整合前幾層中具有類別區(qū)分性的局部信息,全連接層的前向傳播公式可以表示為
(3)
式(3)中:a為某一層全連接層激活后的輸出;z為神經(jīng)元節(jié)點輸出;l為層數(shù);σ為激活函數(shù);W與b分別為對應的權(quán)重矩陣與偏置量。全連接層通過引入激活函數(shù)增加非線性性能,使得網(wǎng)絡模型可以逼近任意的非線性函數(shù),最后一層的全連接層輸出值傳遞到損失函數(shù)進行回歸分類,得到最終的分類結(jié)果[22]。經(jīng)典CNN的結(jié)構(gòu)如圖4所示。
5×5conv,32代表通道數(shù)為32;卷積核尺寸為5×5的卷積層; avgpool為全局池化層; fc,64為通道數(shù)為64的全連接層; softmax為回歸分類輸出函數(shù)圖4 經(jīng)典CNN網(wǎng)絡結(jié)構(gòu)Fig.4 Classic CNN network structure
自神經(jīng)網(wǎng)絡用于故障預測和健康管理以來,越來越多的學者提出性能更加優(yōu)異的卷積神經(jīng)網(wǎng)絡,如VGGNet[23]以及GoogLeNet[24]。但是,隨著卷積神經(jīng)網(wǎng)絡層數(shù)的增加,訓練精確度會下降,并且這種現(xiàn)象不是由參數(shù)不優(yōu)導致的過擬合現(xiàn)象。He等[25]于2015年提出了殘差網(wǎng)絡模型ResNet,才解決了這一網(wǎng)絡層數(shù)增加時精確度下降的問題。
一般認為,增加網(wǎng)絡深度可以提高卷積網(wǎng)絡性能,但事實并非如此,當網(wǎng)絡層數(shù)達到一定的數(shù)目之后,網(wǎng)絡的性能就會飽和,甚至出現(xiàn)退化。由于此時出現(xiàn)訓練精度與測試精度同時下降的現(xiàn)象,因此這種退化并非由過擬合而引起,而是因為,網(wǎng)絡中的前幾層已經(jīng)達到了最佳的訓練效果,之后的層進行函數(shù)逼近就沒有必要性,再向其他方向逼近則會導致網(wǎng)絡退化。而殘差網(wǎng)絡模型可以解決這一問題,從而提高神經(jīng)網(wǎng)絡性能。
經(jīng)典ResNet18模型的網(wǎng)絡結(jié)構(gòu)如圖5所示,網(wǎng)絡由4組卷積組、1組全連接層及softmax輸出層構(gòu)成,pool/2代表池化層且滑動步長為2。在每一個卷積組中包含4層卷積層,且通道數(shù)隨著卷積組數(shù)增加而翻倍,從64增至512,使得更多更深層的特征可以被提取出來,而且,每個卷積組使用跳連結(jié)構(gòu),令網(wǎng)絡層輸出與輸入疊加,從而降低學習結(jié)果對網(wǎng)絡權(quán)重變化的敏感程度,避免網(wǎng)絡退化問題。
圖5 ResNet18模型網(wǎng)絡結(jié)構(gòu)Fig.5 The network structure of the ResNet18 model
因此,采用CNN進行特征提取與分類,解決了傳統(tǒng)特征提取方法嚴重依賴先驗知識這一難題,同時提高對電機故障分類的準確度,且無需對提取的目標特征種類進行取舍。而且通過對傳統(tǒng)CNN結(jié)構(gòu)的適當調(diào)整,如增加網(wǎng)絡層數(shù)、降低維度、引入殘差結(jié)構(gòu)等,可以使網(wǎng)絡適用于非侵入式采集到的一維原始數(shù)據(jù),無需任何人工特征提取,并進一步提升準確率。
由于數(shù)據(jù)集是一維數(shù)據(jù),因此實驗中的所有網(wǎng)絡模型均改為一維卷積核進行訓練:首先采用傳統(tǒng)CNN模型進行訓練,其分類準確率,即正確標注故障情況的能力,僅有73.95%,難以滿足實際生產(chǎn)時的檢測要求,準確率Accuracy計算公式為
(4)
式(4)中:N為樣本總數(shù);Xi表示正確分類為第i種故障的樣本數(shù)。
基于ResNet18的卷積神經(jīng)網(wǎng)絡雖然在現(xiàn)有的數(shù)據(jù)集上可以具有優(yōu)秀的檢測能力,準確率可以達到96.79%,但是網(wǎng)絡中存在過多的冗余參數(shù)導致訓練速度下降,既占用大量資源又減慢了訓練速度。
因此,逐步改進以上網(wǎng)絡結(jié)構(gòu),使得網(wǎng)絡能夠在維持準確率等性能的前提下盡量減少參數(shù)量與訓練時間,優(yōu)化資源。并對不同的改進方式進行調(diào)整與比較,記錄訓練所需的參數(shù)量、每批次訓練時間、收斂輪次以及準確率,其中收斂輪次表示網(wǎng)絡性能幾乎達到最佳準確率時所需的迭代次數(shù),結(jié)果如表1所示。
表1 不同網(wǎng)絡結(jié)構(gòu)性能比較
表1中,結(jié)構(gòu)1、結(jié)構(gòu)2、結(jié)構(gòu)3分別是經(jīng)典ResNet18模型依次減少一個、兩個、三個卷積組的結(jié)構(gòu),其中每個卷積組包含四個卷積層,結(jié)構(gòu)4、結(jié)構(gòu)5以及結(jié)構(gòu)6則是保留三個卷積組,其中每個卷積組簡化為兩個卷積層,最小的卷積組的通道數(shù)依次是16、64、32。
相較于經(jīng)典CNN,使用了殘差結(jié)構(gòu)之后的卷積網(wǎng)絡收斂速度與準確率都會提升,同時,精簡網(wǎng)絡結(jié)構(gòu)即減少層數(shù)會使訓練時間大大縮減,而且網(wǎng)絡參數(shù)主要集中在全連接層。經(jīng)比較,研究中選用性能最佳的結(jié)構(gòu)6進行網(wǎng)絡訓練。
本文研究中設計的卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)如圖6所示,共10層,樣本輸入后通過卷積層與最大池化層提取淺層特征,網(wǎng)絡采取ResNet模型中的殘差跳連機制,提取深層殘差特征,最后進行正則化、全局池化等操作,經(jīng)由Softmax損失函數(shù)進行分類輸出,得到網(wǎng)絡分類結(jié)果。
圖6 本文卷積網(wǎng)絡結(jié)構(gòu)Fig.6 The structure of the convolutional network in this article
Softmax loss通用的函數(shù)表達式為
(5)
式(5)中:L為損失值;t=[t1,t2,…,tN]T為目標值;y=[y1,y2,…,yN]T為預測值,1≤j≤N;N為類別總數(shù),以實現(xiàn)網(wǎng)絡輸出結(jié)果的分類。
在數(shù)據(jù)集有限的情況下,為避免過擬合情況的發(fā)生,在網(wǎng)絡最后的全連接層引入dropout層,即失活層,它的作用是使網(wǎng)絡中一定比例的單元值變?yōu)榱?,從而降低特征重復性,避免因特征冗余而造成的過擬合,從而提升模型的魯棒性與泛化性,dropout層計算公式可以表示為
(6)
(7)
選擇合適的dropout對網(wǎng)絡訓練效果是至關重要的。因為dropout越小,網(wǎng)絡參數(shù)越多,容易出現(xiàn)過擬合現(xiàn)象;dropout越大,會導致所訓練的網(wǎng)絡節(jié)點數(shù)不足,不能有效擬合,從而導致準確率下降。圖7給出了在不同的dropout概率時進行同網(wǎng)絡訓練的準確率,可以看到,在10個網(wǎng)絡中,當dropout概率選取0.2時,網(wǎng)絡效果達到最優(yōu)。
實驗選取樣本總數(shù)的80%進行訓練,20%用來驗證。因樣品數(shù)量較大,采用批次訓練的方式進行訓練,每批次訓練樣本個數(shù)即batchsize的大小會影響網(wǎng)絡的訓練時間。不同batchsize的網(wǎng)絡訓練情況如圖8所示,橫軸表示每批次訓練樣本個數(shù)即batchsize值,縱軸表示每次迭代的訓練時長,在batchsize取64時,訓練時長最低。
圖7 不同失活率的網(wǎng)絡準確率Fig.7 Network accuracy of different dropouts
圖8 不同訓練批次大小的網(wǎng)絡訓練時長Fig.8 Network training time for different batchsize
實驗所使用的計算機內(nèi)存為8 GB,使用英偉達GTX1060顯卡加速模型訓練,顯存為6 GB,選用Python作為編程語言,采用TensorFlow深度學習開源框架。使用仿真得到的數(shù)據(jù)集進行測試,該數(shù)據(jù)集由三相異步電機工作時間中的電流電壓采樣數(shù)據(jù)組成,采樣頻率為5 kHz,總樣本數(shù)為13 700組,隨機選取其中的12 330個樣本組成訓練集,其余1 370個樣本組成測試集。
為了分析訓練批次對網(wǎng)絡性能的影響,以設置最適合的網(wǎng)絡訓練次數(shù),采用縱向比較法,將網(wǎng)絡結(jié)構(gòu)與其他參數(shù)固定后,進行多次網(wǎng)絡訓練,具體網(wǎng)絡結(jié)構(gòu)如表2所示。
網(wǎng)絡性能與訓練次數(shù)關系曲線如圖9所示。由圖9可知,本文提出的神經(jīng)網(wǎng)絡,在訓練到10次左右的時候,準確率已經(jīng)可以達到最佳準確率的90%以上,基本完成收斂,并在后續(xù)的訓練批次中緩慢增加;當訓練次數(shù)達到150次時,損失函數(shù)曲線與準確率曲線都會趨于穩(wěn)定,并隨著訓練次數(shù)增加只會在最高值附近出現(xiàn)微小的波動,即網(wǎng)絡性能不再發(fā)生較大變化?;谝陨戏治?,將訓練次數(shù)設置為150次,即可在相對較短的時間獲得最佳的網(wǎng)絡性能。
表2 本文神經(jīng)網(wǎng)絡算法結(jié)構(gòu)
圖9 訓練次數(shù)對網(wǎng)絡性能的影響Fig.9 Influence of training times on network performance
為了更明確簡潔地表示故障檢測能力,在統(tǒng)計結(jié)果時,將單相短路與相間短路一并統(tǒng)計為短路故障,并繪制不同網(wǎng)絡結(jié)構(gòu)的混淆矩陣,如圖10所示。由圖10可知,相較于傳統(tǒng)CNN結(jié)構(gòu),本文結(jié)構(gòu)的分類結(jié)果更加集中在對角線上,這表示分類能力更優(yōu)。
預測標簽1~3分別對應正常、短路故障、超載故障;矩陣中的元素及其顏色深度表示樣本數(shù)量;橫縱坐標分別表示網(wǎng)絡預測與真實 標簽,則對角元表示正確分類的樣本數(shù)圖10 不同網(wǎng)絡結(jié)構(gòu)的混淆矩陣Fig.10 Confusion matrix of different network structures
提出了一種對ResNet18模型進行簡化后的網(wǎng)絡結(jié)構(gòu),具有高準確率的同時減少了網(wǎng)絡參數(shù)與訓練時長。表3展示了本文網(wǎng)絡與經(jīng)典CNN模型對電機故障檢測的性能對比,同樣在統(tǒng)計時將短路故障匯總為一類故障,使用單項準確率(A)與單項召回率(R)作為評價指標對網(wǎng)絡的分類性能進行比較:單項準確率表示網(wǎng)絡針對某一種故障預測的準確率;單項召回率表示網(wǎng)絡可以從某種故障的全體樣本中正確找出含該故障樣本的概率。兩者計算公式為
(8)
(9)
式中:P與N分別為正負樣本,即某種故障與非某種故障的樣本數(shù);TP與TN分別為預測的正負樣本,即預測為某種故障與預測為非某種故障的樣本數(shù)。
表3 故障檢測能力比較
表3中可以看到,相較于傳統(tǒng)CNN,本文網(wǎng)絡由于性能更優(yōu)而大幅度提高了故障檢測單項準確率。同時,單項召回率也達到了95%以上,這意味著在實際生產(chǎn)中,電機一旦發(fā)生故障,本文的網(wǎng)絡可以更加可靠地根據(jù)非侵入式采集裝置抓取到故障特征以實現(xiàn)診斷,不易遺漏。
表1與表3數(shù)據(jù)表明,本文提出的結(jié)構(gòu)對非侵入式故障檢測任務具有最高的準確率,且具有殘差網(wǎng)絡普遍具有的快速收斂特征,通過減少卷積組數(shù)及縮小全連接層尺寸加快訓練速度,減少參數(shù)量,能夠很好地適應非侵入式采集到的復雜數(shù)據(jù)。同時保有較高的單項準確率與召回率,以適用于實際生產(chǎn),實現(xiàn)了具有優(yōu)勢的非侵入式電機故障識別及分類功能。
搭建了一種非侵入式檢測模型,并仿真電機的故障情況,將總電源信號作為樣本進行電機故障診斷,實現(xiàn)診斷過程的非侵入式。并提出了一種新型的一維殘差卷積網(wǎng)絡結(jié)構(gòu)用于故障分類,使網(wǎng)絡適用于非侵入式采集到的特征較為復雜的數(shù)據(jù),并且網(wǎng)絡具有良好的性能。本文提出的網(wǎng)絡結(jié)構(gòu)對非侵入式故障識別的準確率高達96.79%,這一結(jié)果對于故障診斷來說可以接受,可以作為故障診斷的一種評價標準。相較于傳統(tǒng)CNN模型與ResNet18網(wǎng)絡模型,本文提出的網(wǎng)絡訓練速率更快,準確率與魯棒性更優(yōu),占用資源更少,算法執(zhí)行效率更高。未來可進一步提高網(wǎng)絡泛化能力,以實現(xiàn)同時針對更多種設備的非侵入式故障檢測普遍方法。