李俊卿,劉 靜
(華北電力大學 電氣與電子工程學院,保定 071003)
軸承是電機設備中十分重要的基礎元件,但同時也是最易損的部件之一。由軸承故障診斷的現(xiàn)有研究來看,基于振動信號的診斷方法是國內(nèi)外最為普及且較為有效的檢測方法[1-3]。傳統(tǒng)的診斷步驟主要是通過傳感器采集大量振動信號后,利用信號處理手段分析故障特征從而實現(xiàn)故障診斷。
針對軸承故障信號處理的傳統(tǒng)方法有時域法、頻域法以及時頻分析法[4]。其中,時頻法能從時域和頻域兩個維度獲取信息,可以反映信號的局部特征,從而提取更準確的特征。小波分析是時頻法的代表方法之一,其利用有限長的會衰減的小波基達到了同時獲取頻率與時間特征的效果,得到了廣泛應用。然而,對時頻圖的人工特征提取需要大量的經(jīng)驗和專業(yè)知識。隨著智能化時代的到來,僅僅依賴于傳統(tǒng)特征提取的方法不再適用,其效率低、工作量大、受限于先驗知識和專家經(jīng)驗的問題逐漸凸顯。
2006年,深度學習的先驅(qū)者Hinton在《Science》的發(fā)表了一篇轟動一時的論文,打破了神經(jīng)網(wǎng)絡發(fā)展的瓶頸[5],各行各業(yè)都掀起深度學習的浪潮。作為屬于人工智能領域下機器學習里的分支[6],深度學習具有特征工程完全自動化的優(yōu)勢,克服了傳統(tǒng)的機器學習技術存在的需要進行人工選擇特征的問題,極大地簡化了工作流程。
深度學習的興起開拓出故障診斷的一個新領域,近年來在故障診斷領域的應用逐漸廣泛。文獻[7]提出了一種結合卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)和峭度的故障診斷方法,將振動信號分段處理得到峭度指標,將峭度指標轉(zhuǎn)換為灰度圖,送入卷積神經(jīng)網(wǎng)絡完成故障分類。文獻[8]將一維振動信號以400個數(shù)據(jù)點為樣本長度進行截取,按分段組合的方式構建二維矩陣,并將得到的數(shù)據(jù)矩陣直接輸入卷積神經(jīng)網(wǎng)絡。文獻[9,10]采用相似的分段組合的方式將原始的一維時域信號轉(zhuǎn)換為二維的灰度圖,使用二維卷積神經(jīng)網(wǎng)絡進行特征提取。文獻[11]通過分段組合的方式將原始監(jiān)測信號映射到二維矩陣中,經(jīng)卷積神經(jīng)網(wǎng)絡自動學習高維特征實現(xiàn)軸承的故障診斷。文獻[12]建立了基于一維卷積神經(jīng)網(wǎng)絡的自適應故障診斷模型,以原始振動數(shù)據(jù)直接作為輸入實現(xiàn)故障分類。文獻[13]提出了一種長短期記憶網(wǎng)絡(Long short-term memory,LSTM)與Softmax多分類器結合的診斷方法,將采集的振動信號進行歸一化后,利用長短期記憶網(wǎng)絡處理數(shù)據(jù)提取特征。
可以看出,現(xiàn)有方法的思路大多是將采集到的信號進行分段截取,通過分段組合的方法構建為二維數(shù)據(jù)矩陣,或是將一維的振動信號直接輸入長短時記憶網(wǎng)絡或一維卷積神經(jīng)網(wǎng)絡進行訓練,此類方法的缺點是不能充分提取樣本中的特征。此外,現(xiàn)階段針對電機軸承故障診斷的研究大多基于同一工況下的數(shù)據(jù),提出的方法僅在固定的工況下有較高的準確率。由于實際工程應用中設備的工況多變,要獲取每個工況下大量帶標簽的數(shù)據(jù)比較困難,有效數(shù)據(jù)的缺乏導致方法的泛化性和實用性不高,成了基于深度學習的故障診斷技術的發(fā)展和應用的瓶頸之一。因此,研究一種新的方法能充分提取有限樣本中的特征,并解決變工況下有效樣本不足導致故障診斷效果不佳的問題是必要的。
遷移學習也是機器學習的一個分支,能將學習到的知識遷移到不同但相關的學習任務,在文本、情感和圖像分類上應用廣泛[14]。由于深度學習模型本質(zhì)上具有高度的可復用性,其與遷移學習相結合的方法可以利用現(xiàn)有的數(shù)據(jù)幫助實現(xiàn)新領域的分類。因此,針對以上問題,本文提出了一種結合卷積神經(jīng)網(wǎng)絡和遷移學習的電機軸承故障診斷方法,利用卷積神經(jīng)網(wǎng)絡強大的圖像處理能力,對振動信號小波變換后的彩色時頻圖進行特征提取,并引入遷移學習提升模型在其他工況下的泛化性。
小波變換是時頻法的代表方法之一,其利用的小波基有限長且會衰減,可以同時獲取頻率與時間的信息。相較于傅里葉變換具有了更高的分辨率[15]。相比于同樣是時頻法的短時傅里葉變換,小波變換能更好地平衡時間分辨率和頻率分辨率的表現(xiàn)。相比于離散小波變換,連續(xù)小波變換生成小波系數(shù)能直觀表達信號的全局特征,從而更好的提出信號的特征值,有利于相似信號的辨別和分析。
對函數(shù)f(t)∈L2(R),其連續(xù)小波變換的表達式為
(1)
式中:a表示尺度因子;τ表示平移因子,而Ψa,τ(t)為小波基函數(shù)。由于連續(xù)小波變換在選取小波基時,其函數(shù)波形應與分析對象的特征相似,本文選取cmor小波基。
卷積神經(jīng)網(wǎng)絡是一種應用廣泛的深度學習模型,具有強大的圖像處理能力。CNN由若干卷積層(Convolutional layer)、池化層(Pooling layer)、全連接層(Fully connected layer)組成,如圖1所示。由于卷積層學到的是局部模式,且具有平移不變性,因此對于感知任務可以高效地利用數(shù)據(jù)。此外,CNN的多層次結構可以從大量數(shù)據(jù)中提取深層次關系,避免了人工特征提取的操作,即實現(xiàn)了特征工程自動化[16]。
圖1 CNN模型示意圖Fig.1 Schematic diagram of CNN model
在卷積神經(jīng)網(wǎng)絡的應用中,過擬合往往是核心難題,其原因是訓練樣本較少,導致模型在有限的訓練數(shù)據(jù)上過于優(yōu)化,最終學到的只適用于訓練數(shù)據(jù),而在從未訓練過的數(shù)據(jù)上表現(xiàn)很差。針對此問題,可以從數(shù)據(jù)樣本和網(wǎng)絡結構兩方面入手改進卷積神經(jīng)網(wǎng)絡。本文利用數(shù)據(jù)增強和Dropout機制進行了網(wǎng)絡的優(yōu)化,抑制了過擬合從而提升模型泛化性。
數(shù)據(jù)增強在計算機視覺領域是一種強大的降低過擬合的技術。其方法通過旋轉(zhuǎn)、剪裁和平移等方式,在不改變特征空間結構的前提下,從現(xiàn)有的樣本數(shù)據(jù)中生成更多的有效樣本。由于數(shù)據(jù)是一切機器學習問題的基礎,任何深度學習模型都需要在大量且有效的數(shù)據(jù)上進行訓練,進而獲取準確分類或擬合的能力。數(shù)據(jù)越多,訓練出的模型效果越好。因此,在實際工程應用中遇到樣本不足導致診斷精度不高的問題時,數(shù)據(jù)增強能顯著提升有效樣本的個數(shù),抑制模型過擬合。本文在訓練網(wǎng)絡過程中,通過對圖像隨機進行輕微程度的小角度旋轉(zhuǎn)、小范圍剪裁和平移,從而生成更多可訓練的可信圖像樣本,因此,增加了網(wǎng)絡訓練樣本的數(shù)量,使得訓練好的模型能學習到更多內(nèi)容。
此外,Dropout機制也是防止神經(jīng)網(wǎng)絡過擬合的有效方法之一,對網(wǎng)絡中的某一層使用Dropout機制就是在訓練中隨機地將一些特征設置為0,通過隨機地舍棄特征減少每次訓練的神經(jīng)元數(shù)量,相當于在每一層的輸出里加入噪聲,增強了泛化能力。
遷移學習也是機器學習領域的一個分支,分為樣本遷移、特征遷移、模型遷移、關系遷移等方法。通常來講,基于海量數(shù)據(jù)提取特征的深度學習方法都是通過歷史數(shù)據(jù)進行訓練,然后使用同一學習任務下的數(shù)據(jù)在訓練好的網(wǎng)絡里進行預測或擬合。與之不同的是,遷移學習能從源域中的現(xiàn)有樣本中得到訓練,當有新的應用場景出現(xiàn)時,能利用源域中學習到的知識實現(xiàn)目標域的分類,此時源域和目標域的數(shù)據(jù)不必嚴格滿足獨立同分布的假設[17]。
本文采取的是模型遷移,將訓練過程分為兩個步驟。首先用樣本充足的某一工況下的數(shù)據(jù)集訓練網(wǎng)絡,確定網(wǎng)絡的結構和參數(shù)并進行優(yōu)化,使網(wǎng)絡學習到可通用的泛化特征。通常,網(wǎng)絡結構里越靠底部的層所學習到的特征會越通用,頂層結構則會學習到更加抽象以及專業(yè)化的特征表示。因此,需要應用到不同工況的小樣本數(shù)據(jù)集時,將訓練好的底層卷積層和池化層的參數(shù)權重凍結,僅將全連接層和頂層卷積基的參數(shù)設置為可訓練的。通過凍結頂層結構并設置一個學習率非常小的優(yōu)化器,用不同工況的小樣本數(shù)據(jù)再次訓練,對頂層結構的參數(shù)進行微調(diào),使得網(wǎng)絡大部分參數(shù)不變,僅讓頂層學習到針對不同工況下更專業(yè)的特征。
本文提出的診斷方法的步驟如下:
(1)小波變換得到時頻圖:對原始信號批量進行小波變換,得到有利于進行CNN訓練的圖像;
(2)數(shù)據(jù)集劃分:將所有得到的樣本劃分為訓練集、驗證集和測試集。其中,訓練集用于讓模型學習知識,驗證集用于確定模型的最優(yōu)參數(shù),測試集用于評估模型的最終效果;
(3)用時頻圖訓練CNN:對時頻圖進行預處理,構建卷積神經(jīng)網(wǎng)絡進行訓練,根據(jù)訓練結果確定參數(shù),通過數(shù)據(jù)增強和Dropout機制增加有效樣本并抑制過擬合,從而優(yōu)化網(wǎng)絡;
(4)引入遷移學習提升泛化性:凍結網(wǎng)絡的底層結構,用不同工況的小樣本數(shù)據(jù)對網(wǎng)絡的頂層結構進行微調(diào)。
本文的數(shù)據(jù)選自來自美國凱斯西儲大學(Case Western Reserve University)的滾動軸承試驗臺,該試驗臺主要由電機、軸承和負載電機組成。其故障方式為人為鉆孔或切割,用加速度傳感器采樣振動信號,采樣頻率為12kHz和48kHz。該數(shù)據(jù)集共包括了正常狀態(tài)、內(nèi)圈故障、滾子故障和外圈故障四種類型的樣本。本文選取12kHz采樣頻率下,轉(zhuǎn)速為1797r/min、1772r/min、1750r/min以及1730r/min時的驅(qū)動端振動數(shù)據(jù),分別對應0HP、1HP、2HP、3HP四種不同的工況。圖2為1797r/min轉(zhuǎn)速下采集到的原始加速度振動信號(前2 000個數(shù)據(jù)點)。
圖2 振動信號時域圖Fig.2 Time domain diagram of vibration signal
構建數(shù)據(jù)集A、B、C和D,如表1所示,數(shù)據(jù)集A選取0HP工況下的振動數(shù)據(jù),用以訓練模型,數(shù)據(jù)集B、C和D分別選取1HP、2HP和3HP工況下的數(shù)據(jù),用以驗證模型在其他工況的小樣本下的泛化性和遷移效果。將采集到的數(shù)據(jù)進行分割,在數(shù)據(jù)集A中,每種狀態(tài)只保留前115200個數(shù)據(jù)點,以1280個數(shù)據(jù)點為一個樣本,包含大約轉(zhuǎn)動三圈的數(shù)據(jù),形成90個樣本。依據(jù)此規(guī)則建立4種軸承運行狀態(tài)的數(shù)據(jù)集,包括不同的故障類型和故障程度(故障直徑分別為7in,14in,21in)。為了更好地訓練和評估模型,將正常狀態(tài)下的90個樣本分為60個樣本的訓練集、20個樣本的驗證集以及10個樣本的測試集。同理,將三種故障(內(nèi)圈故障、滾子故障和外圈故障)的各270個樣本分為180個訓練樣本、60個驗證樣本以及30個測試樣本。其中,訓練樣本由三種故障程度(7in,14in,21in)各60個樣本組成,驗證樣本由三種故障程度各20個樣本組成,測試樣本由三種故障程度各10個樣本組成。經(jīng)過構建,數(shù)據(jù)集A共有600個訓練樣本、200個驗證樣本以及100個測試樣本,每個樣本包含1 280個數(shù)據(jù)點。以相似的方式構建另外三個數(shù)據(jù)集,各包含200個訓練樣本、100個驗證樣本以及100個測試樣本。
表1 實驗數(shù)據(jù)集Tab.1 Experimental datasets
結合振動信號的時域圖,選用自適應性能良好的 cmor小波基,對4種狀態(tài)下每個樣本的振動信號分別進行小波變換,得到用于CNN訓練的時頻圖(800×800像素),如圖3所示。
圖3 小波變換時頻圖Fig.3 Wavelet transform time-frequency diagram
在實驗過程中,使用數(shù)據(jù)集A的樣本按批量樣本的輸入方式進行卷積神經(jīng)網(wǎng)絡的訓練,用該數(shù)據(jù)集的驗證樣本確定模型的最優(yōu)參數(shù)。在網(wǎng)絡構建過程中,按照前文所述的理論在網(wǎng)絡的密集連接分類器前加入了Dropout層,并在訓練中使用了數(shù)據(jù)增強技術以抑制過擬合。所有樣本的訓練和測試過程都是基于python語言在pycharm平臺上實現(xiàn)的,其中,本文選取的深度學習前端框架是基于Tensorflow的Keras,本文的數(shù)據(jù)增強的過程是在Kera中通過類ImageDataGenerator實現(xiàn)的,通過隨機旋轉(zhuǎn)、移動、剪切圖像生成更多可信樣本,可以起到抑制過擬合的作用,進而增強模型泛化性。本文模型需要通過實驗確定的網(wǎng)絡參數(shù)有優(yōu)化器類型、卷積層數(shù)、批量樣本大小,按照單一變量法的原則改變參數(shù)進行實驗。
(1)優(yōu)化器的選擇
優(yōu)化器的作用在于決定如何基于損失函數(shù)對網(wǎng)絡進行更新,即確定梯度下降的具體方法。本文備選的優(yōu)化器有 SGD、Adam 和RMSprop,均采用其默認的學習率用于模型訓練。當采用不同優(yōu)化器時,訓練精度隨著訓練批次的變化趨勢如圖4所示。縱坐標為訓練精度,橫坐標為訓練批次,即所有訓練數(shù)據(jù)的迭代次數(shù)。可以看到,相較于SGD和RMSprop優(yōu)化器,Adam的訓練精度的最終值較高,且在迭代次數(shù)較小時便達到了穩(wěn)定,因此選擇Adam優(yōu)化器。
圖4 不同優(yōu)化器的對比Fig.4 Comparison of different optimizers
(2)網(wǎng)絡層的選擇
在卷積神經(jīng)網(wǎng)絡中,卷積層的作用是從數(shù)據(jù)中提取特征,池化層的作用是減少需要處理的特征圖的元素個數(shù),并讓最后一個卷積層包含全部的輸入信息。網(wǎng)絡層數(shù)的選擇對構建網(wǎng)絡來說至關重要,如果網(wǎng)絡層數(shù)過少,那么較小的網(wǎng)絡容量容易出現(xiàn)信息瓶頸,不能處理復雜問題,如果網(wǎng)絡層數(shù)太大,會使得其結構比較復雜,對比較簡單的分類問題來說容易出現(xiàn)過擬合。如表2所示,采用以下五種方案,分別包含不同的卷積層和池化層,對數(shù)據(jù)集進行訓練,在驗證集上的精度如表2所示。從實驗結果可以看出,方案2的精度更高,即應選擇3個卷積層和4個池化層的網(wǎng)絡結構。
表2 不同網(wǎng)絡結構的對比Tab.2 Comparison of different network structures
(3)批處理樣本數(shù)的選擇
網(wǎng)絡在訓練的過程中,目標是找到一組模型參數(shù),使得在給定的訓練樣本和對應目標值上的損失最小。為了不使模型陷入局部最優(yōu),減小損失是通過小批量迭代來實現(xiàn)的,即將訓練樣本分成多個批次進行迭代訓練。選擇不同的批處理樣本數(shù),以每輪的平均訓練時間和驗證集準確率作為評價指標,實驗結果如表3所示??梢钥吹?,批處理樣本為5或者10時,準確率差別不大,但相較于批處理樣本數(shù)為5而言,批處理樣本數(shù)為10時訓練時間明顯較少,訓練速度更快,因此確定批處理樣本數(shù)目為10。
表3 不同批樣本數(shù)的對比Tab.3 Comparison of different batch-sizes
綜合以上實驗結果,本文確定網(wǎng)絡使用Adam優(yōu)化器,批處理樣本數(shù)目為10,網(wǎng)絡結構如下表4所示。該CNN網(wǎng)絡輸入特征圖的大小為150×150,含三個卷積層和四個最大池化層,一個Dropout層,兩個全連接層,共有429萬個參數(shù)需要訓練。三層卷積與四層池化的組合增大了網(wǎng)絡容量,也減小了特征圖的尺寸,使得網(wǎng)絡具備處理復雜圖像的能力,且計算代價不會太大。由于本文的故障診斷本質(zhì)上是一個四分類問題,所以網(wǎng)絡的最后一層用的softmax分類器實現(xiàn)狀態(tài)分類,并用分類交叉熵作為損失函數(shù)。
表4 網(wǎng)絡結構Tab.4 Network structure
經(jīng)小波變換后,數(shù)據(jù)以JPEG文件的形式保存。將保存的圖像解碼為RGB三維矩陣數(shù)據(jù),再將像素值(0~255)縮放到[0,1]區(qū)間。用經(jīng)過預處理后的數(shù)據(jù)對使用了數(shù)據(jù)增強的網(wǎng)絡進行訓練,分別繪制網(wǎng)絡在訓練集和驗證集上的損失和精度,如圖5和圖6所示。從圖像中可以看到,訓練精度和驗證精度隨著時間增加,到第九輪時接近100%,分類效果非常好,訓練損失和驗證損失也在第九輪時接近至0,后面不再變化。
圖5 訓練損失和驗證損失Fig.5 Training and validation loss
圖6 訓練精度和驗證精度Fig.6 Training and validation accuracy
前文的訓練都是基于有充足數(shù)據(jù)的數(shù)據(jù)集A,但在實際工程應用中,往往會出現(xiàn)變工況下有效樣本不足的問題,為了對未訓練工況下的小樣本實現(xiàn)高精度的故障診斷,引入遷移學習的方法。將數(shù)據(jù)集A作為源域數(shù)據(jù)集,其他三個數(shù)據(jù)集作為目標域數(shù)據(jù)集。模型在數(shù)據(jù)集A上訓練完成后,凍結網(wǎng)絡的底層結構,用數(shù)據(jù)集B、C和D的各200個訓練樣本對網(wǎng)絡的頂層結構進行微調(diào),再分別在數(shù)據(jù)集B、C和D的各100個測試樣本上評估分類效果。微調(diào)的具體過程是在對200個樣本進行訓練時通過設置學習率非常小(為1×10-5)的優(yōu)化器來實現(xiàn)的,在底層結構凍結的前提下,極小的學習率使得頂層結構參數(shù)的變化范圍很小,即這次訓練僅會微調(diào)全連接層以及頂層卷積基的參數(shù),不會破壞之前學習到的更加通用的特征。實驗結果如表5所示,可以看到,在有充足訓練樣本的數(shù)據(jù)集A上,準確率達到了99.8%。數(shù)據(jù)集B、C和D的訓練樣本雖然只有數(shù)據(jù)集A的三分之一,但在引入遷移學習后,準確率也能高達95%以上??梢娊Y合卷積神經(jīng)網(wǎng)絡和遷移學習的方法在其他工況樣本不足的情況下是有效的,能極大提升泛化性。
表5 不同數(shù)據(jù)集的準確率Tab.5 Accuracy of different datasets
為了說明提出方法的優(yōu)勢,對比分析了提出方法與以下方法的測試結果。方法一采用卷積神經(jīng)網(wǎng)絡,不進行小波變換和遷移學習,按橫向插樣的方式構建二維數(shù)據(jù)矩陣,構建和本文數(shù)量相同的樣本,并將數(shù)據(jù)矩陣直接作為卷積神經(jīng)網(wǎng)絡的輸入。方法二結合了小波變換和卷積神經(jīng)網(wǎng)絡,但不進行遷移學習。方法三為本文方法,結合了小波變換和卷積神經(jīng)網(wǎng)絡,并引入了遷移學習。
將以上三種方法分別在數(shù)據(jù)集A、B、C和D上進行訓練,為了避免實驗結果的偶然性,對三種方法分別進行10次實驗,取準確率的平均值作為該方法的最終精度,實驗結果如表6所示。
表6 三種方法對比Tab.6 Comparision of three methods
分析實驗結果可得以下結論。三種方法均在數(shù)據(jù)集A上的準確率最高,在數(shù)據(jù)集B、C和D上較低,說明當訓練樣本充足時,能獲得更好的分類效果,當訓練樣本不足時,分類精度將相應降低。對比三種方法,方法一的準確率明顯不如方法二,說明相比于直接將原始信號以數(shù)據(jù)形式輸入,提出方法結合了小波變換,使得卷積神經(jīng)網(wǎng)絡能更好地從時頻圖里能提取特征。此外,方法三在數(shù)據(jù)集B、C和D上的準確率優(yōu)于方法二,說明提出方法在同是小樣本的情況下,通過引入了遷移學習實現(xiàn)了更高的精度。因此,實驗結果證明,小波變換與卷積神經(jīng)網(wǎng)絡結合的方法能充分提取數(shù)據(jù)特征并高效利用樣本,而遷移學習方法的引入使得在變工況時,能利用極少的樣本和訓練時間實現(xiàn)較高的分類精度。
由于數(shù)據(jù)集為不平衡樣本,為了進一步說明提出方法分類的準確性,對本文方法對數(shù)據(jù)集B的分類結果繪制混淆矩陣,如圖7所示。其中,橫坐標的標簽表示模型所預測的運行狀態(tài),縱坐標表示實際的運行狀態(tài),右側條形圖的顏色越深,表明越多的樣本被正確分類。由圖可得,100個樣本中,正常狀態(tài)下的10個樣本全部診斷正確,外圈故障的30個樣本和滾子故障的30個樣本也全部正確分類,僅有內(nèi)圈故障的兩個樣本被錯誤診斷為外圈故障,整體準確率為98%,說明分類效果良好,診斷精度較高。
圖7 混淆矩陣Fig.7 Confusion matrix
本文提出了一種基于卷積神經(jīng)網(wǎng)絡和遷移學習的電機軸承故障診斷方法,在實際的復雜工況中樣本不足,構建可靠分類模型比較困難時,提出方法能利用極少的樣本實現(xiàn)不同工況下的準確故障診斷。提出方法對振動信號小波變換得到有利于卷積神經(jīng)網(wǎng)絡訓練的彩色時頻圖;通過訓練確定網(wǎng)絡的結構和參數(shù),利用數(shù)據(jù)增強技術和Dropout機制優(yōu)化網(wǎng)絡;采用模型遷移的方式,對不同工況下的小樣本實現(xiàn)了準確識別;并通過對比分析驗證了提出方法的有效性。主要創(chuàng)新點如下:
(1)提出方法結合了小波變換和卷積神經(jīng)網(wǎng)絡,利用小波變換獲取時域頻域兩個維度的信息,憑借多層次結構的卷積神經(jīng)網(wǎng)絡強大的圖像處理能力實現(xiàn)特征工程自動化,從大量數(shù)據(jù)中提取深層次關系,充分利用了樣本里的信息;
(2)針對卷積神經(jīng)網(wǎng)絡的過擬合問題,提出方法利用數(shù)據(jù)增強技術和Dropout機制進行了網(wǎng)絡結構和數(shù)據(jù)的優(yōu)化,增加了有效樣本,抑制了過擬合;
(3)提出方法引入了遷移學習,與需要大量帶標簽數(shù)據(jù)的傳統(tǒng)方法相比,能在變工況下的小樣本數(shù)據(jù)上實現(xiàn)較高的準確率,提升了模型的泛化能力,具有明顯優(yōu)勢。